Beruflich Dokumente
Kultur Dokumente
Wolfgang Bertram
8 décembre 2006
ii Introduction
Introduction
Continuité
Qu’est-ce qu’une fonction continue ? Pour trouver une bonne réponse à
cette question, les mathématiciens ont mis plus de cent ans de temps de
réflexion. Peut-être l’auraient-ils trouvée plus vite s’ils avaient commencé
par la question négative : Qu’est-ce qu’une fonction discontinue ? Si l’on
pose la question de cette façon, on arrive tout naturellement à la fameuse
« définition epsilon-delta » de la continuité. Pour simplifier la notation, nous
écrivons d(x, y) = |x− y| pour la distance entre deux points x, y de la droite
réelle R et Br (x) = {y ∈ R| d(x, y) < r} pour l’intervalle de centre x et de
rayon r. Alors voici la formulation logique de la définition de la continuité
d’une fonction f : I → R au point a ∈ I :
(C) (∀ε > 0) (∃δ > 0) (∀x ∈ I ∩ Bδ (a)) d(f (x), f (a)) 6 ε.
Selon les règles de la logique, le contraire logique de (C) est la propriété
suivante :
(NC) (∃ε > 0) (∀δ > 0) (∃x ∈ I ∩ Bδ (a)) d(f (x), f (a)) > ε.
Traduisons la formule (NC) en language usuel : on pourra dire que la fonc-
tion f présente au point a un « saut », d’une certaine hauteur, notée ε, où
ε est un nombre strictement positif. Cela veut dire que l’on peut trouver
des points x aussi proche de a que l’on veut (de distance plus petite que δ,
quel que soit δ > 0), tels que l’écart d(f (x), f (a)) entre f (x) et f (a) soit
toujours plus grand que ε. Souvent, on préfère reformuler les conditions (C)
et (NC) en termes de suites :
(C’) (∀(xn )n∈N , xn ∈ I) xn → x(n → ∞) ⇒ f (xn ) → f (x)(n → ∞)
(NC’) (∃(xn )n∈N , xn ∈ I) xn → x(n → ∞) ∧ f (xn ) 6→ f (x)(n → ∞)
Les définitions (C) et (C’) sont à la base de l’approche moderne à l’analyse ;
elles sont tellement fondamentales, que nous recommandons au lecteur de
les apprendre par cœur comme un poème pour pouvoir les réciter sans
hésitation et en toute circonstance. Ces mêmes définitions gardent tout
leur sens si, par exemple, d(x, y) désigne la distance entre deux points x, y
dans le plan ou dans Rn . On peut donc définir les applications continues
de Rn dans Rm exactement de la même manière. On en parlera au cours
des trois premiers chapitres.
Dérivabilité
Pour n’importe quelle fonction f : I → R et x, y ∈ I avec x 6= y, la pente
est définie par
f (x) − f (y)
P (x, y) := . (0.1)
x−y
On peut interpréter cette expression comme le coefficient directeur de la
sécante de f déterminée par x et y, i.e., de l’hypoténuse dans le triangle
iv Introduction
rectangle marqué par les trois points (x, f (x)), (y, f (y)) et (y, f (x)) dans
le plan R2 . Faisons tendre y vers x : on dit que f est dérivable en x si la
« sécante tend vers la tangente », i.e. :
(D) Pour toute suite yn de points de I qui tend vers x, la limite de la pente
f 0 (x) := limn→∞ P (x, yn ) existe. (On écrit aussi f 0 (x) = limy→x P (x, y).)
Mais il existe aussi une deuxième notion qui est tout aussi naturelle : on
pourra faire bouger les deux extrémités du triangle caractéristique et faire
tendre à la fois x et y vers un point a. Si tout va bien, la sécante devrait,
là encore, tendre vers la tangente :
(DS) Pour toute suite (xn , yn ) de points de I × I qui tend vers (a, a) (et
tel que xn 6= yn ), la limite de la pente f 0 (x) := limn→∞ P (xn , yn ) existe.
(On écrit aussi f 0 (a) = lim (x,y)→(a,a) P (x, y).)
x6=y
La surprise est alors que les deux notions ne coïncident pas ! Donnons un
contre-exemple : la fonction
x sin( x1 ) si x 6= 0
n 2
f : R → R, f (x) =
0 si x = 0
est bien différentiable en tout point x ∈ R : comme | sin( x1 )| 6 1, on trouve
que f 0 (0) = 0, et pour x 6= 0, les règles usuelles de dérivation donnent
f 0 (x) = 2x sin( x1 ) − cos( x1 ). Mais elle ne satisfait pas la condition (DS) :
comme cos( x1 ) a des oscillations de plus en plus rapprochées quand x tend
vers 0, on peut trouver une suite de couples (xn , yn ), disons, avec xn <
yn < 0, telle que xn et donc yn tend vers 0 pour n → ∞, et telle que
P (xn , yn ) = 21 . Mais de la même façon on peut construire une suite avec
des propriétés analogues, mais telle que P (x0n , yn0 ) = − 21 . Pour la suite
mixte obtenue en mettant les deux suites ensemble, la pente n’admet donc
pas de limite. Autrement dit, lim (x,y)→(0,0) P (x, y) n’existe pas.
x6=y
Nous devons donc distinguer ces deux propriétés, et nous dirons que f est
strictement différentiable en a si la condition (DS) est vérifiée. Et voici un
résultat important d’analyse en une variable :
de sorte que
Z 1
f (y) − f (x)
= f 0 (x + u(y − x)) du. (0.3)
y−x 0
Chapitre 1
1. L’espace euclidien Rn
Nous appelons indifféremment points ou vecteurs les éléments x, y, . . . de
l’espace vectoriel Rn et les écrivons sous forme de vecteurs colonnes
x1 y1
.. ..
x = . , y = . .
xn yn
La distance euclidienne entre deux points x, y ∈ Rn est donnée par la
formule célèbre qui remonte à Pythagore :
v
u n
uX
d(x, y) = t (xi − yi )2 .
i=1
2. Espaces vectoriels normés 3
de sorte que d(x, y) = ||x − y||. La norme est liée au produit scalaire cano-
nique de Rn X
hx, yi = xi yi = xt y
i=1
t
(où x est la matrice transposée de x ; c’est donc une matrice ligne, et il
s’agit d’un produit matriciel de type « ligne × colonne » qui donne toujours
un scalaire réel). Alors on a
p
||v|| = hv, vi.
S’il n’y pas de danger de confusion, nous écrivons encore ||v|| au lieu de
N (v) ; mais il faut être conscient du fait que, sur un seul espace il peut
exister plusieurs (même : une infinité de) normes. Pour le cas de V = Rn ,
le lecteur vérifiera que les formules suivantes définissent des normes sur Rn
4 1. Continuité dans les espaces métriques
(pour les exemples (1) et (3), c’est un exercice facile ; l’exemple (4) est plus
difficile et sera traité dans le chapitre 4) :
P
(1) ||v||1 := ni=1 |vi |
Pn
(2) ||v||2 := ( i=1 |vi |2 )1/2 (la norme euclidienne)
(3) ||v||∞ := maxi=1,...,n |vi | (la norme sup)
Pn
(4) ||v||p := ( 1=1 |vi |p )1/p pour p ∈ [1, ∞[ fixé (la p-norme)
(5) ||v||p,A := ||Av||p , où A est une matrice inversible de taille n × n.
On peut visualiser une norme || · || en dessinant sa boule unité
B1 (0) = {x ∈ V | ||x|| < 1}.
Le lecteur est incité à le faire pour n = 2 dans les exemples (1) – (5) ci-
dessus. (Comme matrice A pour l’exemple (5) on pourra choisir une matrice
diagonale.) On constatera alors : la forme de la « boule » dépend fortement
de la norme, et elle n’est pas toujours « ronde ».
Supposons maintenant que (V, || · ||) soit un espace vectoriel normé. On
définit la distance d(x, y) entre x, y ∈ V par
d(x, y) := ||x − y||.
3. Espaces métriques
Ainsi la proposition 1 -2.2 signifie que tout espace vectoriel normé donne lieu
à un espace métrique. D’autres exemples d’espaces métriques sont obtenus
par les deux constructions suivantes :
3. Espaces métriques 5
4.3. Exemple. Dans (Rm , d∞ ), une suite (x(n) )n∈N converge vers x si et
seulement si chacune des composantes est une suite convergente dans R,
i.e., pour i = 1, . . . , m, la suite numérique (x(n) )i converge vers xi .
Si M = M1 × M2 est un produit cartésien de deux espaces métriques, alors
(xn , yn ) → (x, y) (n → ∞) si et seulement si xn → x et yn → y (n → ∞),
et de même pour un produit cartésien de n espaces métriques.
Pour montrer qu’une application est continue, nous allons souvent la « dé-
visser » en une composée, somme, produit ou quotient d’autres applications
continues, en utilisant les résultats suivants :
si f1 (xn ) converge vers f1 (x) et f2 (xn ) converge vers f2 (x) (cf. exemple
1 -4.3).
(2) Si (xn , yn ) → (x, y), alors xn → x pour n → ∞ ; donc pr1 est continue
en (x, y), et pareil pour pr2 .
α∈Nn
Nous allons voir plus tard que ce théorème est en fait vrai pour n’importe
quelle norme sur Rn et Rm , mais faux en dimension infinie.
(FE2)
T Si (Fi )i∈I est une famille quelconque de fermés, alors l’intersection
i∈I Fi est un fermé.
Sn
(FE3) Si F1 , . . . Fn est une famille finie de fermés, alors la réunion i=1 Fi
est un fermé.
La preuve du lemme suivant est laissée comme exercice (??) :
Démonstration. L’implication (1) ⇒ (2) est triviale. Montrons que (2) im-
plique (3). Si f est continue en 0, alors pour ε = 1, il existe δ > 0 tel que
||x|| < δ implique ||f (x)|| < 1. Ainsi, pour tout x 6= 0,
2||x|| x 2
||f (x)|| = ||f ( δ)|| < ||x||
δ 2||x|| δ
x δ 2
puisque || 2||x|| δ|| = 2 < δ. La constante C := δ convient.
Montrons que (3) implique (1). En effet, si (3) est vérifiée, alors
d(f (x), f (y)) = ||f (x) − f (y)|| = ||f (x − y)||
6 C||x − y|| = Cd(x, y).
Ainsi f est C-lipschitzienne, donc continue (remarque 1 -4.8).
pour tout r ∈ R+ :
(2) (2)
BC1 r (0) ⊂ Br(1) (0) ⊂ BC2 r (0).
P pP
6.4. Exemple. Sur V = Rn , les normes ||x||1 = i |x|i et || · ||2 = 2
i xi
et ||x||∞ = maxi |x|i sont toutes équivalentes entre elles : nous conseillons
au lecteur de faire d’abord un dessin des boules unités de ces normes pour
n = 2 ou n = 3, puis de démontrer que (exercice ??)
1
||x||1 6 ||x||∞ 6 ||x||1
n
1 √
√ ||x||1 6 ||x||2 6 n ||x||1 .
n
6.5. Proposition. Deux normes || · ||1 et || · ||2 sur un espace vectoriel réel
V sont équivalentes si et seulement si un ouvert par rapport à la distance
d1 est aussi un ouvert par rapport à d2 , et inversement.
Démonstration. Supposons que || · ||1 et || · ||2 sont équivalentes et que U
est un ouvert par rapport à d1 . Donc, pour tout x ∈ U , il existe ε > 0 tel
(1)
que Bε (x) ⊂ U . On pose ε0 := C1 ε > 0 ; alors
(2) (2)
Bε0 (x) = BC1 ε (x) ⊂ Bε(1) (x) ⊂ U,
Ceci montre que U est un ouvert par rapport à d2 . De la même manière,
on montre que les ouverts de d2 sont aussi des ouverts pour d1 .
Pour la réciproque, supposons que d1 et d2 ont les mêmes ouverts. Comme
(1)
B1 (0) est un ouvert de d1 , elle est aussi ouverte par rapport à d2 . Il existe
(2) (1)
donc ε > 0 tel que Bε (0) ⊂ B1 (0). Cela veut dire que, avec C1 := ε,
la première relation C1 ||x||1 6 ||x||2 est vérifiée. On échangeant les rôles
de d1 et d2 , on démontre la deuxième relation ||x||2 6 C2 ||x||1 , et donc les
deux normes sont équivalentes.
Chapitre 2
Compacité
Au sein des espaces métriques, les espaces compacts jouent un rôle qui est
comparable à celui des ensembles finis en théorie des ensembles. Il existe
deux versions de cette « propriété de finitude topologique » : une version
séquentielle (section 2 -1) et une version ensembliste (section 2 -4).
1. La propriété de Bolzano-Weierstrass
1.1. Définition. Soit (M, d) un espace métrique. On dit que M est séquen-
tiellement compact, ou : M possède la propriété de Bolzano-Weierstrass, si
(BW) toute suite (xn )n∈N de points de M admet une sous-suite (xnk )k∈N
qui est convergente dans M .
Une partie A de M est dite séquentiellement compacte si elle l’est en tant
que sous-espace métrique de M (i.e, toute suite de points de A admet une
sous-suite qui converge dans A).
3. Applications de la compacité
Il faut bien noter qu’en dimension infinie les normes n’ont aucune raison
d’être toutes équivalentes – cf. exercice ??.
ε > 0, il existe δ > 0 tel que, pour tout x, y ∈ M , d(x, y) < δ implique
d(f (x), f (y)) < ε.
Noter que cette propriété est plus forte que la continuité usuelle : on peut
trouver δ qui convient pour tout x. Par exemple, l’application R∗ → R,
t 7→ 1t est continue, mais pas uniformément continue. Une application C-
lipschitzienne est uniformément continue : voir la remarque 1 -4.8.
Chapitre 3
*Espaces topologiques
1. Espaces topologiques
– 21 –
22 3. *Espaces topologiques
Pour garantir l’unicité des limites, dans toute la suite, quand nous parlons
d’espaces topologiques, nous supposons qu’ils soient séparés (des espaces de
Hausdorff ).
2. Applications continues
Il est vrai aussi que, si f est continue en x, alors, pour toute suite xn → x
(n → ∞), on a f (xn ) → f (x) (n → ∞). (Preuve : soit U un voisinage
de f (x) ; on choisit un voisinage W de x tel que f (W ) ⊂ U ; comme xn
converge vers x, il existe N ∈ N tel que, pour tout n > N , xn ∈ W , et
donc aussi f (xn ) ∈ f (W ) ⊂ U ; cela veut dire que f (xn ) converge vers
f (x).) Par contre, la réciproque n’est plus vraie en général. Autrement
dit, la caractérisation « séquentielle » de la continuité, si pratique dans les
espaces métriques, cesse d’être possible dans les espaces topologiques plus
généraux. Dans beaucoup de cas, le lemme suivant sert à remplacer ces
arguments séquentiels :
2.5. Remarque sur les catégories. Chaque fois qu’on rencontre une
structure mathématique (espace vectoriel ; espace métrique ; espace topolo-
gique, etc.), on cherche à définir des morphismes de cette structure (appli-
cation linéaire = morphisme d’espaces vectoriels ; isométrie = morphisme
d’espaces métriques ; application continue = morphisme d’espaces topo-
logiques, etc.), et à démontrer une version de la proposition précédente
(« la composée de morphismes est un homomorphisme », « l’identité est
un morphisme »). Alors nous dirons que les objets en question, avec leurs
morphismes, forment une catégorie. Nous ne donnons pas ici une définition
3. Les structures algébriques topologiques 25
3.1. Définition.
(GT) Un groupe topologique est un groupe G muni d’une topologie T telle
que la multiplication de groupe m : G × G → G, (g, h) 7→ m(g, h) = gh et
l’inversion j : G → G, g 7→ g −1 sont des applications continues.
(EVT) Un espace vectoriel topologique (sur R) (abrégé : e.v.t.) est un
espace vectoriel V sur R, muni d’une topologie T , telle que les applications
a : V × V → V, (u, v) 7→ u + v
m : R × V → V, (r, v) 7→ r · v
sont continues.
(AT) Un anneau topologique est un anneau (A, +, ·) muni d’une topologie
telle que l’addition + : A × A → A et la multiplication · : A × A → A sont
continues.
(CT) Un corps topologique est un corps (K, +, ·) muni d’une topologie telle
que l’addition + : K × K → K, la multiplication · : K × K → K et l’inversion
j : K× → K sont continues (où K× = K \ {0} ; c’est un ouvert car {0} est
un fermé).
26 3. *Espaces topologiques
3.2. Exemples.
(EVT) Tout e.v. normé est un e.v.t. (exemple 1 -4.10) ; il existe des e.v.t.
dont la topologie ne provient pas d’une norme (exercice ??).
(GT) Le groupe (Rn , +), le groupe général linéaire GL(n, C) et ses sous-
groupes Sl(n, R), O(n),... sont des groupes topologiques (exercice ??).
(AT) Les anneaux de matrices M (n, R) et les anneaux de polynômes
R[x]/(p) pour p un polynôme non-nul sont des anneaux topologiques (exer-
cice ??).
(CT) K = R, C, Q ou tout corps compris entre Q et C avec la topologie
induite par C fournit un exemple de corps topologique.
Nous allons évoquer quelques aspects simples des e.v.t. dans le chapitre
?? et des corps et anneaux topologiques dans le chapitre ?? et dans les
exercices avancés. Citons, pour terminer, juste un résultat qui met en relief
encore une fois l’unicité de la topologie des espaces vectoriels de dimension
finie :
Chapitre 4
*Interlude : Convexité
1. Parties convexes
Une partie C ⊂ V est dite convexe si, pour tout p, q ∈ C, le segment [p, q]
est entièrement dans C.
Une semi-norme sur V est une application N : V → R telle que, pour tout
v, w ∈ V ,
(SN1) N (v) > 0,
(SN2) N (rv) = |r| · N (v),
(SN3) N (v + w) 6 N (v) + N (w).
Les ensembles Br (x) = {y ∈ V | N (x − y) < r} sont appellés les semi-boules
(ouvertes) de cette semi-norme.
– 27 –
28 4. *Interlude : Convexité
Toute norme est une semi-norme, mais la réciproque est fausse : par exemple,
Rn → R, x 7→ |x1 | est une semi-norme qui n’est pas une norme (si n > 1).
Le lecteur dessinera les semi-boules de cette semi-norme pour n = 2 ou
n = 3.
2. Fonctions convexes
Montrer que ceci définit une norme sur Rn . (Indications. Utiliser l’inégalité
de Hölder pour démontrer l’inégalité de Minkowski ||x+y||p 6 ||x||p +||y||p .)
Montrer aussi que
lim ||x||p = ||x||∞ .
p→∞
Chapitre 5
γn (t)
où I est un intervalle de R (ouvert ou non, de longueur finie ou non). Si
γ est continue, on parle de courbe continue. D’après le lemme 1 -4.15, une
courbe γ est continue si et seulement si toutes les composantes γi : I → R
sont continues. Il est utile de penser au paramètre t comme le « temps »
et à γ(t) comme décrivant la trajectoire d’un point de masse dans Rn en
fonction du temps t. Les physiciens écrivent souvent x(t) au lieu de γ(t).
– 31 –
32 5. Les courbes différentiables
i.e., si elles sont dérivables (dans le sens usuel) et la dérivée γi0 : I → R est
encore continue. Alors la courbe dérivée est définie par
0
γ1 (t)
0 ..
γ (t) := . .
γn0 (t)
Ainsi γ 0 : I → Rn est une courbe continue. Nous dirons que γ est de classe
C 2 si elle est de classe C 1 et si γ 0 est encore de classe C 1 , auquel cas
on peut définir la dérivée seconde γ 00 (t) := (γ 0 )0 . Ainsi de suite, on définit
les classes C k , k ∈ N. En langage motivé par la mécanique, on dit que
γ 0 (t) est la vitesse et γ 00 (t) est l’accélération (au temps t), notée parfois
v(t) = x0 (t) = ẋ(t), resp. a(t) = x00 (t) = ẍ(t).
Rb
Démonstration. Soit v := a γ(t)dt. Alors (en utilisant l’inégalité de Cauchy-
Schwarz en passant de la première ligne à la ligne suivante)
Z b Z b
||v||2 = hv, vi = hv, γ(t) dti = hv, γ(t)i dt
a a
Z b Z b
6 ||v|| ||γ(t)|| dt = ||v|| ||γ(t)|| dt.
a a
2.5. Remarque. Le résultat reste vrai pour une norme quelconque. Pour
les normes || · ||∞ et || · ||1 , le lecteur pourra le vérifier à titre d’exercice. Par
contre, dans le cas général, la preuve devient nettement plus sophistiquée.
3. La pente
Pour toute courbe γ : I → Rn , on peut définir la pente par
γ(t) − γ(s)
P (s, t) := (s 6= t).
t−s
On peut l’interpréter comme la vitesse moyenne entre les temps t et s. Dans
la vie quotidienne (radars automatiques, championnats d’athlétisme etc.),
3. La pente 35
γ <1> (t, t). Or, ceci signifie que γ est dérivable avec dérivée γ 0 (t) = γ <1> (t, t).
Finalement, comme γ <1> est continue, t 7→ γ <1> (t, t) = γ 0 (t) aussi est
continue.
36 5. Les courbes différentiables
(1) ⇒ (2) : Nous devons montrer que, pour une courbe γ de classe C 1 ,
l’application définie par
n γ 0 (t) si s = t
γ <1> (s, t) := γ(s)−γ(t)
s−t si s 6= t
est continue sur I × I. En effet, d’après le lemme 5 -3.1, nous avons pour
s 6= t, Z 1
γ <1> (s, t) = γ 0 ((ut + (1 − u)s) du ,
0
Chapitre 6
La classe C 1 et la
différentielle
1.1. Définition. On dit que f admet une dérivée directionnelle (au point
x et en direction v) si la courbe γx,v est différentiable en 0, autrement dit,
si la limite
f (x + tv) − f (x) d
∂v f (x) := lim = |t=0 f (x + tv)
t→0 t dt
existe ; alors ∂v f (x) est dit la dérivée directionnelle de f au point x en
direction v.
Peut-être le lecteur aura déjà rencontré les dérivées partielles d’une fonction
f . Elles sont liées aux dérivées directionnelles comme suit : soit e1 , . . . , en la
base canonique de Rn . Alors la dérivée partielle (par rapport à la ie variable)
– 37 –
38 6. La classe C 1 et la différentielle
2. La classe C 1
Pour x fixé, l’intégrand est continu en fonction de (v, s), et donc, d’après
le lemme sur les intégrales à paramètres (5 -3.3), f (x + v) est continue en
fonction de v, donc limv→0 f (x + v) = f (x + 0) = f (x), ce qui signifie que
f est continue en x.
est valable, et, d’après le lemme sur les intégrales à paramètres (5 -3.3), le
membre de droite définit bien une application continue pour (y, w, r) dans
un voisinage de (x, v, 0).
3. La différentielle
fm (x)
le coefficient à la place (ij) de la matrice de Df (x) est
(Df (x))ij = (Df (x)ej )i = (∂j f (x))i .
Comme f est supposée C 1 , l’application x 7→ ∂j f (x) est continue, et donc
x 7→ (Df (x))ij est continue, pour tout i = 1, . . . , m, j = 1, . . . , n.
42 6. La classe C 1 et la différentielle
La matrice de Df (x) par rapport aux bases canoniques est appelée la ma-
trice jacobienne de f au point x, notée souvent Jf (x). Nous venons de voir
que ses coefficients sont (Jf (x))ij = (∂j f (x))i . Or, en écrivant composante
par composante
f (x + tej ) − f (x) fi (x + tej ) − fi (x)
(∂j f (x))i = lim i
= lim = (∂j fi )(x),
t→0 t t→0 t
on trouve que (∂j f )i = ∂j fi , de sorte que la matrice jacobienne est donnée
par
∂1 f1 (x) · · · ∂n f1 (x)
Jf (x) = ((∂j fi )(x)) i=1,...,m = .. ..
j=1,...,n . . .
∂1 fm (x) · · · ∂n fm (x)
Pour bien mémoriser cette définition, il faut se souvenir que la matrice
jacobienne contient comme colonnes les dérivées partielles de f par rapport
à e1 , . . . , en . Par exemple, si f est une fonction scalaire (i.e., W = R,
m = 1), alors Jf (x) est une matrice ligne, et si f est une courbe (i.e.,
n = 1), alors Jf (x) est une matrice colonne, donc un vecteur de Rm .
donne
Df −1 (f (x)) ◦ Df (x) = D(f −1 ◦ f )(x) = D(idU )(x) = idV ,
Df (f −1 (y)) ◦ Df −1 (y) = D(f ◦ f −1 )(y) = D(idU )(y) = idV
et en posant y = f (x), ceci implique que Df −1 (f (x)) = (Df (x))−1 , ou
−1
bien Df −1 (y) = Df f −1 (y) .
Chapitre 7
La classe C 1 – exemples et
règles de calcul
• « attaque directe » :
– écrire f (x+tv)−f
t
(x)
– simplifier ... (c’est ici qu’il faut parfois trouver des astuces)
– après simplification : prolongement continu, pour t = 0 inclus.
• « dévisser et décomposer » : écrire la fonction en question sous forme
de composée, somme, produit ou quotient (ou une combinaison de tout
cela) d’applications dont on sait qu’elles sont de classe C 1
• « par dérivées partielles » : on vérifie que les dérivées partielles de f
existent et sont continues (voir le théorème 7 -2.4 ci-dessous).
1. Exemples
Dans la suite, soit V = Rn et W = Rm .
(0) Fonctions d’une variable. Assurons-nous tout d’abord que pour des
fonctions f : I → R définies sur un intervalle I, nous récupérons l’ancien
calcul différentiel : pour tout t 6= 0 et v 6= 0, la limite pour t → 0 de
f (x + tv) − f (x) f (x + tv) − f (x)
= v
t tv
– 45 –
46 7. La classe C 1 – exemples et règles de calcul
g
que f (U ) ⊂ R∗ , alors f1 = i ◦ f est de classe C 1 , et de même pour f = g · f1 .
De plus, en dévissant on trouve la règle de différentiation
g (∂v g)f − g(∂v f )
∂v ( ) = .
f f2
En particulier, une fonction rationnelle f (x) = p(x)
q(x) (quotient de deux po-
lynômes, définie sur l’ouvert U = q (R )) est de classe C 1 sur U .
−1 ∗
Démonstration. Supposons (1). Alors ∂(v,0) f (x, y) = f [1] ((x, y), (v, 0), 0)
existe et est continue en fonction de (x, y, v), et de même en deuxième
variable. De plus, par linéarité de Df (x, y),
Df (x, y)(v, w) = Df (x, y)((v, 0) + (0, w))
= Df (x, y)(v, 0) + Df (x, y)(0, w)
= D1 f (x, y)v + D2 f (x, y)w.
Suite à l’hypothèse, pour les deux intégrales, l’intégrand est une fonction
continue de ((x, y), (v, w), t, s), et donc (d’après le lemme sur les intégrales
à paramètres, lemme 5 -3.3) le membre de droite est une fonction continue
de ((x, y), (v, w), t), et donc f est C 1 .
Chapitre 8
1. La dérivée seconde
– 53 –
54 8. Les classes C k , k > 2
Nous devons démontrer que f [1] est de classe C 1 . Suite à l’hypothèse, l’in-
tégrand est une fonction C 1 des variables (x, v, s, t). Pour conclure que
l’intégrale est une fonction C 1 des variables (x, v, t), on applique le lemme
suivant :
2. Symétrie
Comme f [2] est continue et cette égalité a lieu pour tout t, s 6= 0, elle reste
vraie, par densité, aussi pour t = s = 0 :
f [2] (x, v, 0), (w, 0, 0), 0 = f [2] (x, w, 0), (v, 0, 0), 0
Or, en vue de la continuité de f [2] , le calcul fait au début de la preuve
signifie que
∂w ∂v f (x) = lim lim f [2] (x, v, s), (w, 0, 0), t
t→0 s→0
= f [2] (x, v, 0), (w, 0, 0), 0 ,
et ainsi ∂w ∂v f (x) = ∂v ∂w f (x).
Le lemme de Schwarz dit précisément qu’il est sans importance lequel des
deux isomorphismes canoniques nous utilisons.
C’est donc la matrice des dérivées partielles secondes, qui est une matrice
symétrique, et on peut exprimer D2 f (x) par cette matrice via
X X
D2 f (x)(u, v) = Hij ui vj = ui vj ∂i ∂j f (x)
i,j i,j
(exercice ??). Noter aussi que, dans le cas d’une seule variable (n = 1),
la matrice hessienne est une matrice 1 × 1 qui s’identifie avec la dérivée
seconde usuelle f 00 (x).
3. La classe C k
La définition de la classe C k se fait par récurrence : nous dirons que f :
U → W est k + 1 fois continûment différentiable ou de classe C k+1 , si f
est de classe C k , et si, pour toute famille v1 , . . . , vk de vecteurs de V , la
dérivée directionelle itérée
∂v1 (. . . ∂vk f ) : U → W
existe et est encore de classe C 1 . Nous dirons que f est lisse ou de classe
C ∞ si elle est de classe C k pour tout k ∈ N. Par récurrence, le théorème
8 -1.2 implique :
∂i1 . . . ∂ik f : U → W
est continue.
un objet d’une complexité énorme [le nombre de variables est de 2k+1 − 1] que, au jour
d’aujourd’hui, personne ne comprend vraiment. Ou, tout au moins, l’auteur de ces lignes
ne le prétend pas.
60 8. Les classes C k , k > 2
Chapitre 9
La formule de Taylor
– 61 –
62 9. La formule de Taylor
1. Développement à l’ordre 0
Commençons par une remarque triviale : Une application f est continue au
point x0 , si et seulement si on peut écrire f (x0 + h) = f (x0 ) + R(h), avec
un terme reste tel que limh→0 R(h) = 0. C’est un développement de f à
l’ordre 0 . Si f est de classe C 1 , et par rapport à des normes sur V et sur W ,
on peut rendre ce développement plus précis, en utilisant la représentation
R1
intégrale f (x0 + h) = f (x0 ) + 0 Df (x0 + sh)h ds :
Z 1
||R(h)|| =||f (x0 + h) − f (x0 )|| = || Df (x0 + sh)hds||
0
Z 1
6 ||Df (x0 + sh)h||ds (théorème 5 -2.4)
0
Z 1
6 ||Df (x0 + sh)|| · ||h||ds (norme d’opérateur)
0
Z 1
= ||Df (x0 + sh)||ds · ||h||
0
6 ||h|| · sup ||Df (x0 + sh)||.
s∈[0,1]
Il s’ensuit que f est C-lipschitzienne sur toute boule B r (x0 ) qui est contenue
dans U , avec constante de Lipschitz
2. Développement à l’ordre 1
Si f est de classe C 1 , nous pouvons écrire, comme ci-dessus,
Z 1
f (x0 + h) = f (x0 ) + Df (x0 )h + Df (x0 + sh)h − Df (x0 )h ds,
0
R1
et en nous pouvons majorer le reste φ(h) = 0
(Df (x0 + sh) − Df (x0 ))h ds
de la même façon :
Z 1
||φ(h)|| = ||f (x0 + h) − f (x0 ) − Df (x0 )h|| = || (Df (x0 + sh) − Df (x0 ))hds||
0
Z 1
6 ||(Df (x0 + sh) − Df (x0 ))h|| ds (théorème 5 -2.4)
0
Z 1
6 ||Df (x0 + sh) − Df (x0 )|| · ||h||ds (norme d’opérateur)
0
Z 1
= ||Df (x0 + sh) − Df (x0 )||ds · ||h||
0
6 ||h|| · sup ||Df (x0 + sh) − Df (x0 )||.
s∈[0,1]
Ceci prouve
(Il s’agit bien d’une application polynomiale : cf. le point (6) de la section
7 -1.) Nous définissons aussi le terme reste d’ordre j par
Rj (h) := f (x0 + h) − Tj (h),
de sorte que f (x0 +h) = Tj (h)+Rj (h). Bien entendu, le polynôme de Taylor
et le terme reste dépendent de x0 ; s’il faut faire apparaître cette dépendence
dans la notation, nous écrivons Tjx0 et Rjx0 . Le théorème de Taylor donne
une représentation intégrale du terme reste et décrit son comportement
lorsque h tend vers 0.
Chapitre 10
Analyse vectorielle
1. Champs de vecteurs
– 67 –
68 10. Analyse vectorielle
[inserer graphique !]
2. Les 1-formes
Si f : U → R est une fonction de classe C 1 , alors sa dérivée Df : U → V ∗
n’est pas un champ de vecteurs car elle prend ses valeurs dans l’espace dual
V ∗ et non dans V . On dira qu’elle est une 1-forme :
3. Gradients 69
Par convention, on écrit souvent hφ, vi au lieu de φ(v) pour une forme
linéaire φ ∈ V ∗ et un vecteur v ∈ V , et ainsi on écrit hω(x), vi au lieu de
(ω(x))(v). Si V = Rn (autrement dit, si on fixe une base dans V ), alors
ω(x) : Rn → R est une matrice ligne, et hω(x), vi est un produit « matrice
ligne × matrice colonne » :
ω(x) = (ω(x)e1 , . . . , ω(x)en ) =: (ω1 (x), . . . , ωn (x)),
X
hω(x), vi = ωi (x)vi .
i
3. Gradients
Quand on travaille sur Rn , on a tendance à identifier des vecteurs lignes
et vecteurs colonnes, autrement dit, à identifier V (vecteurs colonnes) avec
son espace dual V ∗ (vecteurs lignes), en confondant une matrice avec sa
matrice transposée. Mais il est très important de garder en tête que, pour
un espace vectoriel V quelconque (de dimension finie), il existe une infinité
de façons d’identifier V avec son dual V ∗ ; cela représente un choix plus
au moins arbitraire. Rappelons du cours d’algèbre linéaire que ce choix
peut être effectué en utilisant un produit scalaire1 sur V . Soit donc h·, ·i
1 De manière plus générale, on pourra utiliser une forme bilinéaire non-dégénérée
quelconque (qu’on supposera symétrique). Nous proposons au lecteur plus avancé de
70 10. Analyse vectorielle
∂n f (x)
est sa matrice transposée.
Pour donner une interprétation géométrique du gradient, nous pensons (au
cas n = 2) à la fonction f : U → R comme associant à un point x de
la surface terrestre sa hauteur f (x) au-dessus (ou en-dessus) du niveau
de l’océan. Ainsi f représente un relief montagneux. Dans une carte, on
représente un tel relief par des lignes de niveau f = const. Dans un relief
montagneux, les cours d’eau traversent de manière orthogonale ces lignes :
ils prennent la ligne de descente maximale que l’on pourra appeler une ligne
orographique.
4. Extrema locaux
Les points culminants d’un relief sont certainement d’un interêt particulier.
Si f : U → R est une fonction scalaire et p ∈ U , nous dirons que p est un
maximum global de f sur U si f (y) 6 f (p) pour tout y ∈ U . Nous dirons
que ce maximum est strict si l’inegalité est stricte pour y 6= p, et nous
dirons que p est un maximum local (strict) s’il existe ε > 0 tel que p soit un
maximum (strict) de f sur la boule Bε (p). De manière analogue, on définit
des minima (stricts), globaux ou locaux, de f .
D’après la dernière condition, pour tout ε > 0, il existe δ > 0 tel que
|h| < δ implique |R|h|2 (h)|
2 < ε. On prend ε = 14 . Alors |h| < δ implique
1
|R2 (h)| < 4 |h| , donc R2 (h) > − 14 |h|2 et
2
1 1 1
f (p + h) > f (p) + |h|2 − |h|2 = f (p) + |h|2 > f (p)
2 4 4
si h 6= 0. Par conséquent, p est un minimum local strict.
(2) On applique la partie (1) à la fonction −f .
(3) D’après la partie (1), la courbe γ(t) := f (x + tv) a un minimum strict
en t = 0 (car γ 00 (0) = D2 f (p)(v, v) > 0), et d’après la partie (2), la courbe
ρ(t) := f (x + tw) a un maximum strict en t = 0. Donc p ne peut pas être
un extremum local de f .
Rappelons que les mineurs principaux de H sont les déterminants des sous-
matrices Hr de H obtenues en enlevant de H les r dernières lignes et
colonnnes, r = 0, 1, . . . , n − 1. Pour n = 2, le critère (4) permet des vérifi-
cations très rapides (mais faire attention de bien traduire ce critère au cas
d’une matrice définie négative, ce qui signifie que −H est définie positive).
Cependant, le calcul des valeurs propres et vecteurs propres (calcul qui
exige souvent un effort important, voire est impossible) fournit des infor-
mations plus précieuses : il donne, dans un sens, une description complète
de la géométrie de la fonction f au voisinage du point critique (« Lemme de
Morse », voir le théorème ?? ; pour attaquer les exercices correspondants,
il faut attendre le chapitre 11).
74 11. Recherche de primitives ; connexité
Chapitre 11
Recherche de primitives ;
connexité
1. Le problème
Le problème de résoudre des équations différentielles commence par la re-
cherche de primitives : si f : U → W est une application de classe C 1 , on
peut calculer sa différentielle qui est une application continue Df : U →
Hom(V, W ). Comme dans le cas d’une variable, on espère qu’il existe une
opération réciproque. Mais dans le cas n > 1 ce problème est plus compli-
qué. Rappellons tout d’abord du chapitre 10 les définitions suivantes :
donc f est constante sur U . Les constantes sont donc les seules solutions
de Df = 0 sur une boule.
2. Connexité
(1) Df = 0
(2) f est constante.
Démonstration. Clairement, si f est constante, on a Df = 0.
Réciproquement, soit Df = 0 sur U . Soit x0 ∈ U et c := f (x0 ). Il est clair
que U est une réunion disjointe des ensembles U1 et U2 suivants
U1 := {x ∈ U | f (x) = c}, U2 := {z ∈ U | f (z) 6= c} = f −1 (R \ {c}).
L’ensemble U2 , étant l’image réciproque d’un ouvert par une application
continue, est ouvert. L’ensemble U1 est également ouvert : soit z ∈ U1 et
r > 0 tel que Br (z) ⊂ U ; alors, d’après l’exemple 11 -1.2, f est constante
sur la boule Br (z), et donc Br (z) ⊂ U1 , et ainsi U1 est ouvert. Comme
U est connexe et U1 non-vide, il faut que U2 soit vide. Donc U = U1 , et
f = const = c.
3.1. Définition. Nous dirons qu’une 1-forme de classe C 1 est fermée si elle
vérifie la condition (3.1). Ainsi nous avons la condition nécessaire : si une
1-forme ω de classe C 1 admet une primitive, alors elle est fermée. Avec la
notion introduite dans la section 10 -2, la condition s’écrit aussi
h∂v ω(x), ui = h∂u ω(x), vi.
En choisissant u = ek et v = ej , toujours avec les notations de la section
10 -2, nous constatons que ω est fermée si et seulement si
∂ωk ∂ωj
∀j, k = 1, . . . , n : (x) = (x).
∂xj ∂xk
Ou encore, en termes de la dérivée extérieure (section 10 -2) : ω est fermée
si et seulement si dω = 0.
Vérifions que Df (x)v = hω(x), vi. Par dérivation sous le signe intégral,
Z 1
Df (x)v = ∂v f (x) = ∂v hω(tx), xi dt
0
Z 1
= th(∂v ω)(tx), xi + hω(tx), vi dt
0
Z 1
= th(∂x ω)(tx), vi + hω(tx), vi dt (ω fermée !)
0
Z 1
d
= hω(tx), tvi dt
0 dt
= hω(x), vi − hω(0), 0i = hω(x), vi
pour tout v ∈ V , et donc Df (x) = ω(x).
4.2. Exemple. Soit (ω(x))(v) = t xAv comme dans l’exemple 11 -3.2 ci-
dessus. Si A est une matrice symétrique, alors ω est fermée. Comme U = Rn
est bien étoilé, il existe alors une primitive f . (La calculer explicitement !)
Chapitre 12
1.1. Définition. Une suite de Cauchy dans un espace métrique (M, d) est
une suite (xn )n∈N dans M telle que limn,m→∞ d(xn , xm ) = 0, i.e., pour tout
ε > 0, il existe N ∈ N tel que, pour tout m, n > N , on a d(xn , xm ) < ε.
1.2. Lemme. Une suite convergente dans un espace métrique est une suite
de Cauchy.
Démonstration. Si xn est une suite convergente, alors, pour tout ε > 0, il
existe N ∈ N tel que d(xn , x) < 2ε pour tout n > N , et donc d(xn , xm ) <
d(xn , x) + d(xm , x) < ε si m, n > N .
1.3. Définition. Un espace métrique (M, d) est dit complet si toute suite
de Cauchy converge dans M . Un espace de Banach est un espace vectoriel
normé qui est complet pour la métrique d(x, y) = ||x − y||.
1.4. Exemple. Soit (V, ||·||) un espace vectoriel normé.P∞ Une série de terme
général un est dite absolument convergente si la série n=1 ||un || converge
Pn
dans R. Alors la suite des sommes partielles, xn = j=1 un , est de Cauchy :
Pm
en effet, d(xn , xm ) 6 j=n+1 ||uj || converge vers 0 pour n, m → ∞, d’après
la condition nécessaire de convergence dans R. Ainsi, dans un espace de
Banach, la convergence absolue d’une série entraîne sa convergence au sens
usuel.
1.5. Théorème.
(i) Par rapport à n’importe quelle norme, Rn est un espace de Banach.
(ii) Une partie M de Rn est complète si et seulement si elle est fermée.
Démonstration. (i) Pour n = 1, par la définition même des nombres réels,
R est complet. Pour n > 1, la preuve de la complétude de Rn s’en déduit
par récurrence : remarquons d’abord qu’une suite dans Rn est de Cauchy
par rapport à une norme si et seulement si elle l’est par rapport à une
norme équivalente. Comme toutes les normes sur Rn sont équivalentes (th.
2 -3.2), il suffit alors de montrer que Rn est complet par rapport à la norme
|| · ||∞ . Dans ce cas, Rn est le produit direct des espaces métriques Rn−1
et R, et il suffit de prouver l’assertion suivante : si (Mi , di ), i = 1, 2, sont
deux espaces métriques complets, alors le produit direct M = M1 × M2 est
également complet. Preuve : soit (xm , ym )m∈N une suite de Cauchy dans M ,
i.e. max(d1 (xm , xn ), d2 (ym , yn )) → 0 (n, m → ∞). Il s’ensuit que (xm )m∈N
est une suite de Cauchy dans M1 et (ym )m∈N en est une dans M2 . Comme
M1 et M2 sont complets, ces suites convergent vers des points x ∈ M1 ,
resp. y ∈ M2 , et ainsi (xm , ym )m∈N converge vers (x, y).
(ii) Puisque nous venons de voir que Rn est complet, il suffit de démontrer
le suivant : une partie M dans un espace métrique complet N est complète
si et seulement si elle est fermée dans N . Preuve : soit (x)m∈N une suite
de Cauchy dans M . Comme N est complet, cette suite converge vers une
limite y ∈ N . Alors (x)m∈N converge dans M si et seulement si la limite y
appartient à M , et donc M est complet si et seulement si M contient toutes
les limites de suites de M , et c’est le cas si et seulement M est fermée dans
N.
La partie (ii) montre que, par exemple, les sphères, les boules fermées et
les sous-espaces vectoriels sont des parties complètes de Rn .
82 12. Le théorème du point fixe ; complétude
2.1. Définition. Une contraction d’un espace métrique est une application
f : M → M qui est lipschitzienne avec une constante de Lipschitz C < 1.
Autrement dit, pour tout x, y ∈ M , d(f (x), f (y)) 6 C d(x, y).
Rappelons que les applications itérées de f sont définies par
f 2 := f ◦ f, . . . , f n+1 := f ◦ f n = f n ◦ f.
Par récurrence, on voit immédiatement que, si f est C-lipschitzienne, alors
f n est C n -lipschitzienne ; ainsi la suite f n contracte M « de plus en plus
fort ». On verra que, à la limite, cette suite envoie M sur un seul point :
n1 − C m−n
=C d(x0 , x1 ) → 0 (n, m → ∞).
1−C
Par conséquent, (xn ) est une suite de Cauchy. Comme M est complet, cette
suite converge vers un élément p ∈ M . Alors p est un point fixe : comme f
3. Espaces de Banach 83
2.3. Remarque. Par le même genre de calcul que ci-dessus on trouve aussi
la majoration
Cn
d(p, xn ) 6 d(x1 , x0 )
1−C
qui permet de mesurer la qualité de l’approximation de p par la suite xn .
3. Espaces de Banach
Le résultat suivant permet de construire des espaces de Banach de dimen-
sion infinie :
En effet, ceci résulte du fait que W est complet et que fn (x) est une suite
de Cauchy dans W (dans les cas (1) et (2), ||fn (x) − fm (x)|| 6 ||fn − fm ||∞
tend vers 0 pour n, m → ∞ car fn est de Cauchy, et dans le cas (3) nous
avons
||fn (x) − fm (x)|| 6 ||fn − fm ||op ||x|| → 0 (n, m → ∞).)
On pose alors f (x) := y. Montrons ensuite cas par cas que la fonction
f : M → W (resp. f : V → W ) ainsi définie appartient à l’espace en
question, et que fn converge vers f dans cet espace.
(1) Comme fn est une suite de Cauchy, pour ε > 0, il existe N tel que
∀m, n > N, ∀x ∈ M : ||fn (x) − fm (x)|| < ε.
On prend la limite pour m → ∞, donc
∀m > N, ∀x ∈ M : ||fn (x) − f (x)|| 6 ε. (∗)
En fixant une valeur de n, on en déduit d’abord que
sup ||f (x)|| 6 sup ||f (x) − fn (x)|| + sup ||fn (x)|| 6 ε + ||fn ||∞
x∈M x∈M x∈M
est finie (car fn est bornée), et donc f est bornée. De plus, (∗) implique
que ||fn − f ||∞ 6 ε, et donc fn converge vers f dans B(M, W ).
(2) Il suffit de montrer que C B(M, W ) est fermé dans B(M, W ) (cf. preuve
du théorème 12 -1.5), autrement dit, si fn → f uniformément et toutes les
fn sont continues, alors f est continue. Pour la preuve, fixons x ∈ M et
écrivons
||f (x) − f (y)|| 6 ||f (x) − fn (x)|| + ||fn (x) − fn (y)|| + ||fn (y) − f (y)||.
Pour ε > 0 donné, on choisit n ∈ N tel que ||fn − f ||∞ < 3ε , i.e., ||fn (z) −
f (z)|| < 3ε pour tout z ∈ M . Comme fn est continue, il existe δ > 0
tel que, si d(x, y) < δ, alors ||fn (x) − fn (y)|| < 3ε . Ensemble, cela donne
||f (x) − f (y)|| < ε si d(x, y) < δ ; donc f est continue au point x.
(3) Il est facile de montrer que f est linéaire en utilisant que les fn sont li-
néaires. Des arguments analogues à celles de la preuve du point (1) montrent
qu’alors fn est continue et que fn → f dans L(V, W ).
85
Chapitre 13
– 85 –
86 13. Inversion locale et fonctions implicites
√
K = R, l’inverse local f −1 (x) = x existe, tandis que pour K = Q il
n’existe pas.
b) Dans le cas n = 1, on peut donner une preuve très simple de ce théorème
en utilisant la notion de monotonie (exercice ??). Cette preuve n’a pas
de généralisation évidente au cas n > 1.
c) Même si Df (a) est inversible pour tout a ∈ U , on ne peut pas conclure
qu’un inverse global existe : un exemple pour cette situation est la fonc-
tion exponentielle exp : C = R2 → C = R2 , (x, y) 7→ ex (cos y, sin y) (cf.
exercice ??).
Démonstration. (2) ⇒ (1) : sous la condition du point (2), la différentielle
Df (a) est inversible avec inverse D(f −1 )(f (a)), voir le corollaire 6 -3.6.
C. Posons U2 = B r2 (0) et
U1 := {x ∈ Br (0)| f (x) ∈ B 2r (0)} = Br (0) ∩ f −1 (B r2 (0))
(qui est ouvert car f est continue). Nous affirmons : La restriction f |U1 :
U1 → U2 est une bijection. Preuve de cette affirmation : Injectivité. Si
y ∈ B r2 (0), d’après la partie B de la preuve, il existe un unique x ∈ B r (0)
tel que y = f (x). Donc il existe au plus un antécédent de y dans U1 .
Surjectivité. Avec y et x comme ci-dessus, il faut montrer que x ∈ U1 .
Comme f (x) = y, on a bien x ∈ f −1 (B r2 (0)). Reste a démontrer que
x ∈ Br (0). Or, pour tout z, z 0 ∈ B r (0), en utilisant que z = g0 (z) + f (z),
z 0 = g0 (z 0 ) + f (z 0 ), on trouve
||z − z 0 || = ||g0 (z) + f (z) − (g0 (z 0 ) + f (z 0 ))||
6 ||g0 (z) − g0 (z 0 )|| + ||f (z) − f (z 0 )||
1
6 ||z − z 0 || + ||f (z) − f (z 0 )||
2
(car g0 est 21 -lipschitzienne) et donc
||z − z 0 || 6 2||f (z) − f (z 0 )||.
Pour z 0 = 0 et z = x, ceci nous donne ||x|| 6 2||f (x)|| < r car f (x) ∈ B r2 (0).
Le membre de droite est bien une fonction continue de (y, h0 , t), pour t =
0 inclus (car composée de fonctions continues ; rappelons que l’inversion
matricielle est continue), et donc φ est bien de classe C 1 (et pour t =
0 on retrouve le résultat déjà connu par le corollaire 6 -3.6 : Dφ(y)h0 =
Φ(φ(y), 0)−1 h0 = Df (φ(y)))−1 h0 ).
linéaires, on peut espérer que, si l’ensemble des solutions n’est pas vide,
qu’il soit paramétré par k := n − m paramètres « libres ». Quitte à re-
numéroter les axes de coordonnées de Rn , on pourra alors s’arranger à ce
que ces paramètres libres soit les premiers k coordonnées de Rn ; on écrit
donc z = (x, y), x ∈ Rk , y ∈ Rn−k .
Ces considérations nous amènent au problème modifié suivant : pour ré-
soudre une équation de la forme F (x, y) = c (où x ∈ Rk , y ∈ R` , avec
c ∈ Rm donné), on cherche une fonction f (x) telle que F (x, y) = c équi-
vaut à y = f (x) ; l’ensemble des solutions sera donc l’ensemble des points de
la forme (x, f (x)) (le graphe de f ). Considérons l’exemple k = ` = m = 1 et
F (x, y) = x2 + y 2 . Les « ensembles de niveau » F = const sont des cercles
concentriques dans R2 . Si la tangente à un tel cercle au point (a, b) ∈ R2
est verticale, on ne peut pas paramétrer, au voisinage de ce point, l’arc
de cercle sous la forme (x, f (x)), tandis que si la tangente n’est pas ver-
ticale (ce qui veut dire que ∂2 F (a, b) 6= 0), alors c’est possible, au moins
localement. Prenons un autre exemple :
2
3 2 x − y2
F : R → R , F (x, y, z) =
x2 − z 2
Pour c ∈ R2 , l’équation F (x, y, z) = c équivaut à deux équations en trois
inconnues. On peut donc espérer que, « dans le meilleur des cas », l’ensemble
des solutions soit paramétré par un paramètre réel, par exemple, qu’il soit
de la forme (x, f (x)), avec une fonction f : R → R2 , ou peut-être de la forme
(h(z), z), pour une autre fonction h : R → R2 . Le résultat suivant donne
un critère suffisant pour assurer l’existence de telles fonctions – comme le
montre le premier exemple, une telle solution existe, en général, seulement
localement.
D2 Ψ2 (x, y) est de rang nul (sinon, elle aurait au moins une colonne non-
nulle, et le rang de DΨ(x, y) était au moins r + 1), et donc D2 Ψ2 (x, y) = 0.
En particulier, D2 Ψ2 (0, 0) = 0, et
1r 0 1r 0
Dg(0, 0) = =
−D1 Ψ2 (0, 0) 1m−r − D2 Ψ2 (0, 0) −D1 Ψ2 (0, 0) 1m−r
est inversible, et donc g est un difféomorphisme local. De plus, la condition
D2 Ψ2 (x, y) = 0 au voisinage de (0, 0) implique que Ψ2 (x, y) ne dépend que
de x. Nous écrivons Ψ2 (x, y) = Ψ2 (x). En utilisant ceci, un calcul direct
montre que
g ◦ f ◦ h(x, y) = g(Ψ(x, y)) = g x, Ψ2 (x, y)
= x, Ψ2 (x, y) − Ψ2 (x, Ψ2 (x, y))
= x, Ψ2 (x) − Ψ2 (x) = (x, 0) = πr (x, y)
ce qui démontre le théorème dans le cas général.
Chapitre 14
Extrema liés
Nous avons déjà étudié le problème de déterminer les extrema d’une fonc-
tion f sur un ouvert de Rn (section 10 -4). En pratique, le problème se
pose souvent sous une autre forme : on veut déterminer les extrema d’une
fonction f sur une partie S de Rn qui n’est pas ouverte mais plutôt de la
forme « g = const », i.e.,
S = {x ∈ U | g(x) = d}
où g : U → W = R est une application de classe C 1 et d ∈ W . (C’est donc
m
1. L’espace tangent
– 95 –
96 14. Extrema liés
Bibliographie
Commentaire. Les livres de Cartan [3] et de Dieudonné [6] sont des clas-
siques du domaine en France ; les deux sont écrits dans l’esprit de l’œuvre
de Bourbaki (cf. [2]) et sont donc de niveau assez élévé – par exemple, le
calcul différentiel y est traité, dès le départ, dans les espaces de Banach qui
peuvent être de dimension infinie. Il en est de même pour les cours de Lang
[7] et de Chaperon [4] qui, néanmoins, sont plus facile à lire. En particulier,
je recommende le livre [4] de Marc Chaperon, qui contient beaucoup plus
de matériel que nous avons pu présenter ici et pourra servir comme lecture
ultérieure (en Master et en préparation d’Agrégation).
Nous n’avons, dans ce cours, traité que peu de sujets d’analyse fonctionelle
– les livres [6], [7] et [8] contiennent beaucoup plus de matériel, qui fera, en
partie, objet d’un cours de Master.
Finalement, l’article [1] est étroitement lié à l’approche au calcul différentiel
présentée dans ce cours.
– 99 –