Sie sind auf Seite 1von 90

2 Ensembles convexes

Les chapitres 2 et 3 presentent les elements danalyse convexe qui nous seront utiles
pour etudier les probl`emes doptimisation et les algorithmes qui les resolvent. Le
chapitre 2 sinteresse aux ensembles convexes, le chapitre 3 aux fonctions convexes.
Lanalyse convexe est une theorie situee entre lalg`ebre lineaire et lanalyse non
lineaire, dans laquelle les objets etudies, bien que non lineaires, sont contraints de
verier une condition particuli`ere qui leur conf`ere des proprietes remarquables. Cette
theorie et ses concepts interviennent en optimisation pour de nombreuses raisons.
Par exemple, lecriture des conditions doptimalite passe par le linearise de lensemble
admissible, qui est un c one; un objet qui nappartient pas ` a lalg`ebre lineaire mais ` a
lanalyse convexe. Autre exemple : dans les probl`emes doptimisation convexe (crit`ere
et ensemble admissible convexes), tous les points stationnaires sont des minima
globaux, ce qui simplie singuli`erement le probl`eme.
Nous ne chercherons pas ` a etre exhaustif. Cela demanderait de trop longs deve-
loppements. Ceux-ci peuvent etre trouves dans les ouvrages specialises cites dans les
notes en n de chapitre 3. Nous esperons toutefois que letude de ces deux chapitres
apportera au lecteur une aisance susante dans cet univers merveilleux et tr`es utile.
Si la theorie est parfois dicile, elle contient aussi beaucoup de resultats simples ` a
demontrer pourvu que lon matrise la technique; leur demonstration est alors proposee
en exercice. Mais lanalyse convexe a aussi des armations simples ` a enoncer, qui
semblent tr`es naturelles, mais que lon ne sait pas demontrer. On y prendra garde !
Dans ce chapitre nous introduisons la notion densemble convexe, donnons quelques
exemples densembles convexes (en particulier une description assez precise des poly`e-
dres convexes), demontrons leurs principales proprietes (geometriques et topologiques)
et decrivons quelques operations sur les ensembles convexes (projection, separation,
prise du dual). En chemin (proposition 2.15), nous serons amenes ` a demontrer un
resultat dexistence de solution pour les probl`emes doptimisation lineaire qui nous
sera aussi utile au chapitre 17.
Comme cest le cas dans tout cet ouvrage, lespace vectoriel sur lequel on travaille,
note E, est suppose de dimension nie sur R; cela ne sera pas toujours precise dans
lenonce des resultats.
2.1 Denition et premi`eres proprietes
Soient E un espace vectoriel de dimension nie sur R et x, y E. On appelle segment
de E, un ensemble note et deni comme suit
[x, y] := (1t)x + ty : t [0, 1].
13
14 2. Ensembles convexes
Lorsque x ,= y, on denit les segments [x, y[, ]x, y] et ]x, y[, en rempla cant dans la
formule ci-dessus, lintervalle [0, 1] respectivement par les intervalles [0, 1[, ]0, 1] et
]0, 1[. Lorsque x = y, les segments [x, y[, ]x, y] et ]x, y[ sont vides, par denition.
On dit quune partie C de E est convexe si pour tout x, y C, le segment [x, y]
est contenu dans C. On dit aussi que C est un convexe. La gure 2.1 illustre cette
x
y
x
y
convexe non convexe
y x
non convexe convexe
Fig. 2.1. Denition dun ensemble convexe
notion. Lensemble de gauche est convexe car il contient tous les segments [x, y] avec
des points x et y lui appartenant. Le second ne lest pas car une partie du segment
[x, y] qui y est represente nest pas dans lensemble. Le cas des deux carres ` a droite est
plus delicat car la question se joue sur la fronti`ere (la partie de celle-ci appartenant ` a
lensemble est marquee dun trait continu). La partie de la fronti`ere qui appartient ` a
lensemble a ete dessinee en trait plein. Le carre de gauche est convexe, bien quil ne
contienne pas toute sa fronti`ere. Celui de droite ne lest pas, car le segment ]x, y[ ne
lui appartient pas, alors que x et y sont supposes appartenir ` a lensemble.
Exemples et proprietes immediates
Ci-dessous, E, E
1
, E
2
et F sont des espaces vectoriels.
1) La partie de R
n
denie par R
n
+
:= x R
n
: x 0 est un convexe appele orthant
positif. La notation x 0 veut dire que x
i
0 pour tout indice i 1, . . . , n.
2) La somme C
1
+ C
2
:= x
1
+ x
2
: x
1
C
1
, x
2
C
2
de deux convexes C
1
et C
2
de E est un convexe. Le produit C := x : x C dun scalaire R par un
convexe C est un convexe (voir aussi lexercice 2.1).
3) Si C
i

iI
est une famille quelconque de convexes de E, alors leur intersection

iI
C
i
est un convexe (mais pas leur union !).
4) Soit A : E F une application lineaire. Limage directe A(C) (resp. limage
reciproque A
1
(C)) dun convexe C de E (resp. de F) par A est un convexe.
5) Soient C
1
E
1
et C
2
E
2
. Alors C
1
C
2
est convexe dans E
1
E
2
si et seulement
si C
1
et C
2
sont convexes.
6) On appelle poly`edre convexe de E un ensemble de la forme x E : Ax b, o` u
A : E R
m
est une application lineaire, b R
m
et linegalite Ax b se comprend
composante par composante : (Ax)
i
b
i
, pour tout i 1, . . . , m. Cest donc
lintersection dun nombre ni de demi-espaces. Dapr`es ce qui prec`ede, cest un
convexe.
7) On appelle simplexe unite de R
n
lensemble deni par
2.2. Aspects geometriques 15

n
:=
_
x R
n
: e

x = 1, x 0
_
,

3
0
o` u e = (1, . . . , 1) R
n
. Cest un convexe (intersection de deux convexes : un sous-
espace ane et lorthant positif).
8) On note S
n
lespace vectoriel des matrices dordre n symetriques. Il est de dimen-
sion n(n + 1)/2. Les ensembles
S
n
+
:= A S
n
: A est semi-denie positive
S
n
++
:= A S
n
: A est denie positive
sont convexes. En eet, si A et B S
n
+
, alors pour tout t [0, 1] et tout vecteur
v R
n
, on a v

((1t)A + tB)v = (1t)v

Av + tv

Bv 0, ce qui montre que


(1t)A + tB S
n
+
. On raisonne de meme pour S
n
++
.
2.2 Aspects geometriques
En alg`ebre lineaire, il est naturel de considerer le plus petit sous-espace vectoriel
contenant un ensemble donne P de E, ainsi que de son enveloppe ane qui est le
plus petit sous-espace ane contenant cet ensemble (section 2.2.1). Lanalyse convexe
associe ` a P de nouveaux ensembles : son enveloppe convexe qui est le plus petit convexe
contenant P (section 2.2.2), son enveloppe convexe fermee qui est le plus petit convexe
ferme contenant P (section 2.5.4) et son enveloppe conique qui est le plus petit c one
convexe contenant P (section 2.2.3).
2.2.1 Enveloppe ane
Soit P une partie dun espace vectoriel E. Lintersection de sous-espaces anes etant
un sous-espace ane, on peut parler du plus petit sous-espace ane contenant P, qui
est donc lintersection de tous les sous-espaces anes contenant P. Cest ce que lon
appelle lenveloppe ane de P. On la note
a P :=

A : A est un sous-espace ane contenant P.


On appelle combinaison ane de E, un element x de E de la forme
x =
m

i=1
t
i
x
i
,
o` u m N

, t = (t
1
, . . . , t
m
) R
m
verie e

t = 1 et les vecteurs x
i
E.
16 2. Ensembles convexes
Proposition 2.1 1) Un ensemble est un sous-espace ane si et seulement si il
contient toutes les combinaisons anes de ses elements.
2) Si P E, alors a P est lensemble des combinaisons anes des elements
de P :
a P =
_
m

i=1
t
i
x
i
: m N

, t
i
R avec
m

i=1
t
i
= 1, x
i
P
_
. (2.1)
Demonstration. 1) Soit A un sous-espace ane. Presque par denition (voir lexer-
cice A.5), A contient les combinaisons anes formees de deux de ses elements. On
raisonne ensuite par recurrence en supposant quun sous-espace ane A contient les
combinaisons anes formees de m de ses elements, avec un certain m 2. Soient
alors m + 1 elements x
i
A et des t
i
R veriant

m+1
i=1
t
i
= 1. Il y a au moins un
des t
i
,= 1. Supposons que ce soit t
1
. On ecrit :
m+1

i=1
t
i
x
i
= t
1
x
1
+ (1t
1
)
_
m+1

i=2
t
i
1t
1
x
i
_
.
Cet element est dans A car les facteurs de t
1
et de 1t
1
sont dans A (par recurrence
pour le second). Reciproquement, on savait dej` a quun ensemble contenant les com-
binaisons formees de deux de ses elements est un sous-espace ane.
2) Soit X lensemble ` a droite dans (2.1). On verie facilement que cet ensemble
contient P (prendre m = 1) et est ane, donc a P X. Inversement, X est contenu
dans lensemble deni comme ` a droite dans (2.1), mais avec des x
i
pris dans a P
plut ot que dans P. Dapr`es la premi`ere partie de la proposition, ce dernier ensemble
est a P. Donc X a P. 2
On dit que les vecteurs x
0
, x
1
, . . . , x
p
de E sont anement independants si p = 0
ou si lune des conditions equivalentes suivantes est veriee :
(A
1
)

p
i=0

i
x
i
= 0 et

p
i=0

i
= 0 = tous les
i
sont nuls,
(A
2
) les vecteurs x
i
x
0
: i = 1, . . . , p sont lineairement independants,
(A
3
) quel que soit j 0, 1, . . . , p, les vecteurs x
i
x
j
: i = 0, . . . , p, i ,= j sont
lineairement independants.
On parle parfois de la dimension dun ensemble convexe C : cest la dimension de son
enveloppe ane a(C). Si dimC = p, C contient au moins et au plus p + 1 vecteurs
anement independants.
2.2.2 Enveloppe convexe
Soit P une partie de E. Lintersection de convexes etant convexe, on peut parler
du plus petit convexe contenant P, qui est donc lintersection de tous les convexes
contenant P. Cest ce que lon appelle lenveloppe convexe de P. On la note
conv P :=

C : C est un convexe contenant P.


2.2. Aspects geometriques 17
On appelle combinaison convexe de E, un element x de E de la forme
x =
m

i=1
t
i
x
i
,
o` u m N

, t = (t
1
, . . . , t
m
)
m
(orthant positif) et les vecteurs x
i
E.
Proposition 2.2 1) Un ensemble est convexe si et seulement si il contient toutes
les combinaisons convexes de ses elements.
2) Si P E, alors conv P est lensemble des combinaisons convexes des
elements de P :
conv P =
_
m

i=1
t
i
x
i
: m N

, t = (t
1
, . . . , t
m
)
m
, x
i
P
_
. (2.2)
Demonstration. 1) Soit C un convexe. Par denition, C contient les combinaisons
convexes formees ` a partir de deux elements de C (m = 2). On raisonne ensuite par
recurrence en supposant que C contient les combinaisons convexes formees de m
elements de C (m 2). Alors pour une combinaison convexe de m + 1 elements de
C, on ecrit (on peut supposer que t
1
,= 1, sinon le resultat est evident) :
m+1

i=1
t
i
x
i
= t
1
x
1
+ (1 t
1
)
_
m+1

i=2
t
i
1 t
1
x
i
_
.
Cet element est dans C car les facteurs de t
1
et de 1 t
1
sont dans C (par recurrence
pour le second). Reciproquement, si C contient toutes les combinaisons convexes de
ses elements, il contient les combinaisons convexes formees de deux elements. Donc C
est convexe.
2) Il est facile de voir que lensemble des combinaisons convexes des elements de
P est un convexe. Il contient donc conv P qui est le plus petit convexe contenant P.
Inversement, par la premi`ere partie, conv P etant un convexe, il contient toutes les
combinaisons convexes des elements de conv P donc de P. 2
`
A droite dans (2.2), on ne peut pas se contenter de prendre m = 2. Par exemple,
si P est forme des trois sommets dun triangle non degenere, cet ensemble serait alors
la fronti`ere du triangle, qui nest pas convexe. Par contre, si P = C
1
C
m
est
lunion de m convexes C
i
, conv P est lensemble des combinaisons convexes de m
points x
i
, chacun des x
i
etant pris dans un convexe C
i
dierent (voir lexercice 2.3).
Le theor`eme de Caratheodory ci-dessous sinscrit dans le meme esprit, celui de limiter
le nombre de termes ` a prendre dans la somme de (2.2). Il arme quen dimension n,
il sut de prendre m = n + 1 dans (2.2). Ce resultat est utile pour passer ` a la limite
dans des combinaisons convexes.
18 2. Ensembles convexes
Theor`eme 2.3 (Caratheodory [76; 1911]) Soit P une partie dun espace
vectoriel E de dimension n. Alors tout element de conv P peut secrire comme
une combinaison convexe de n + 1 elements de P.
Demonstration. Supposons que x conv P secrive comme combinaison convexe
de m > n + 1 elements x
i
de P : x =

m
i=1
t
i
x
i
, avec t := (t
1
, . . . , t
m
)
m
. Il sut
de montrer que lon peut ecrire x comme combinaison convexe de m 1 des x
i
. On
peut supposer que tous les t
i
> 0 (sinon le travail est fait).
En nombre m > n + 1, les x
i
sont anement dependants, si bien que lon peut
trouver := (
1
, . . . ,
m
) ,= 0, tel que
m

i=1

i
x
i
= 0 et
m

i=1

i
= 0.
Comme ,= 0, il existe un indice k tel que
k
> 0 (cet indice k sera mieux choisi par
la suite). On peut donc ecrire
x
k
=

1im
i,=k

k
x
i
et x =

1im
i,=k
_
t
i
t
k

k
_
x
i
.
On voit que

1im, i,=k
(t
i
t
k

i
/
k
) = 1, si bien que le resultat sera demontre si
t
i
t
k

i
/
k
0 pour tout i ,= k. Ceci secrit encore (on se rappelle que les t
i
et
k
sont > 0) :

k
t
k


i
t
i
, pour tout i ,= k.
Cette condition specie comment choisir lindice k arg max
i
/t
i
: 1 i m, qui
fournit bien un
k
> 0. 2
2.2.3 Enveloppe conique
On dit quune partie K dun espace vectoriel E est un c one si tK K, pour tout t 0,
autrement dit si tx K d`es que x K et t 0. Soit P une partie de E. Lintersection
de c ones convexes etant un c one convexe, on peut parler du plus petit c one convexe
contenant P, qui est donc lintersection de tous les c ones convexes contenant P. Cest
ce que lon appelle lenveloppe conique de P (on devrait dire son enveloppe conique
convexe). On la note
cone P :=

K : K est un c one convexe contenant P.


On appelle combinaison conique de E, un element x de E de la forme
x =
m

i=1
t
i
x
i
,
o` u m N

, les t
i
R avec t
i
0 et les vecteurs x
i
E. La demonstration de la
proposition suivante est laissee en exercice (lexercice 2.5).
2.2. Aspects geometriques 19
Proposition 2.4 1) Un ensemble est un c one convexe si et seulement si il con-
tient toutes les combinaisons coniques de ses elements.
2) Si P E, alors cone P est lensemble des combinaisons coniques des
elements de P :
cone P =
_
m

i=1
t
i
x
i
: m N

, t
i
R avec t
i
0, x
i
P
_
. (2.3)
2.2.4 C one asymptotique
Soit C un ensemble convexe ferme non vide dun espace vectoriel E de dimension
nie. On appelle c one asymptotique (ou c one de recession) de C, lensemble deni
par
C

:= d E : C +R
+
d C.
De fa con imagee et ` a une translation pr`es, cest lapparence que prend C lorsquon le
voit de tr`es tr`es loin. Il apparat alors comme un c one, reduit eventuellement ` a zero
(si et seulement si il est borne; cest ce que nous allons montrer).
Il est clair que le c one asymptotique est aussi lintersection pour x C des c ones
C

(x) := d E : x +R
+
d C =

t>0
C x
t
.
Proposition 2.5 Soit C un ensemble convexe ferme non vide. Alors C

est un
c one convexe ferme non vide (il contient zero). De plus
(i) C

= d E : il existe x
k
C et t
k
tels que x
k
/t
k
d,
(ii) C

= C

(x), quel que soit x C.


Demonstration. Pour tout t > 0, (C x)/t est un convexe ferme. Il en est donc de
meme de C

(x) et donc de C

=
xC
C

(x). Dautre part, il est clair que C

est
un c one (d C

et t > 0 impliquent que td C

) et quil contient zero.


Designons par K lensemble dans le membre de droite de (i). Soit x C. Pour
demontrer (i) et (ii), il sut de montrer que C

(x) = K.
Soit d C

(x). Avec t
k
et x
k
= x+t
k
d, on a x
k
C et x
k
/t
k
d. Donc
d K. Inversement, soient x
k
C et t
k
tels que x
k
/t
k
d. Fixons t > 0.
D`es que t
k
t,
x +
t
t
k
(x
k
x) C
et ce point converge vers x + td C (ferme). Donc d C

(x). 2
Si C nest pas ferme, C

(x) peut dependre de x. Par exemple, si C = x R


2
:
x > 0 (0, 0), C

(x) est lorthant positif si x ,= 0, mais C

(0) = C.
20 2. Ensembles convexes
Dapr`es le point (i) de la proposition precedente, C

adh(R
+
C), mais on na pas
legalite en general. Par exemple si C = 1 R, C

= 0 alors que adh R


+
C = R
+
.
Le corollaire suivant exprime ` a sa mani`ere quun ensemble convexe ferme est borne
si et seulement si il ne contient pas de demi-droite, cest-` a-dire densemble de la forme
x + td : t 0, o` u x et d E.
Corollaire 2.6 (bornitude de C et C

) Soit C un ensemble convexe ferme


non vide. Alors C est borne si et seulement si C

= 0.
Demonstration. Dapr`es la proposition 2.5 (i), si C est borne, C

= 0. In-
versement, si C nest pas borne, il existe une suite de points x
k
C telle que
t
k
:= |x
k
| et x
k
/|x
k
| d ,= 0. Dapr`es la proposition 2.5 (i), d C

. 2
Dautres proprietes du c one asymptotique sont donnees aux exercices 2.9 et 2.16.
2.2.5 Faces et points extremes
Soit C un convexe. On dit que F C est une face de C si F est convexe et si tout
segment [x, y] de C dont linterieur relatif ]x, y[ intersecte F est enti`erement dans F.
Cette derni`ere condition peut aussi secrire
x, y C, t ]0, 1[, (1t)x + ty F = x, y F.
On peut aussi ne considerer que le cas t =
1
2
:
x, y C,
1
2
(x + y) F = x, y F.
Une face de C dont lenveloppe ane est de dimension un est appelee une arete.
Une intersection quelconque de faces etant une face, on peut parler de la plus
petite face de C contenant une partie A C, que lon appelle la face engendree
par A. Cest donc lintersection de toutes les faces de C contenant A. On la note
F(A) :=

F : F est une face de C contenant A.


On notera F(x) la face engendree par le singleton x C.
On appelle point extreme une face reduite ` a un seul point. Un tel point est donc
caracterise par le fait quil ne peut pas secrire comme la demi-somme de deux points
distincts de C ou encore par le fait que C x est encore convexe. Lensemble des
points extremes de C est note
ext(C).
Necessairement ext(C) C (la fronti`ere de C).
2.3. Aspects topologiques 21
2.3 Aspects topologiques
Soit P une partie dun espace vectoriel E. En analyse convexe, on rencontre sou-
vent des ensembles convexes dont linterieur dans E est vide : cest le cas des faces
dun poly`edre convexe (celles dierentes du poly`edre lui-meme). Il est donc utile
dintroduire la notion dinterieur relatif dun ensemble P (non necessairement con-
vexe), qui est son interieur dans son enveloppe ane a P, munie de la topologie
induite de celle de E. On le note
1
P

ou intr P. On a
P

intr P = x P : il existe r > 0 tel que (B(x, r) a P) P. (2.4)


On dit quune partie P de E est un ouvert relatif de E ou est relativement ouverte
dans E si P

= P.
Si P est reduit ` a un point, a P = P et donc P

= P. On gardera ` a lesprit que


loperation ()

ne preserve pas linclusion, meme pour des ensembles convexes : C


1
,
C
2
convexes et C
1
C
2
, C

1
C

2
. Toutefois, pour des parties P
1
et P
2
dun meme
espace vectoriel, on a bien s ur :
P
1
P
2
a P
1
= a P
2
_
= P

1
P

2
.
Le lemme suivant est souvent utile pour traiter les questions liees ` a linterieur
relatif des ensembles convexes. Sa demonstration est illustree ` a la gure 2.2.
x z
t
B(z
t
, r
t
)
x
0
B(x, r)
y
z
Fig. 2.2. Illustration de la demonstration du lemme 2.7
Lemme 2.7 (crit`ere dinteriorite relative) Soit C est un convexe non vide.
Alors
x C

et y C = [x, y[ C

.
D`es lors, un point x E est dans linterieur relatif de C si et seulement si pour
tout y C (ou y a C), il existe t > 1 tel que (1t)y + tx C.
Demonstration. Considerons la premi`ere partie lorsque x ,= y (sinon [x, y[ = et
il ny a rien ` a demontrer). Soient t [0, 1[ et B la boule-unite. Il faut montrer que
1
La notation P

nous est propre. Elle est formee du symbole



qui rappelle quil sagit dun
interieur (dans la notation fran caise) et de

qui evoque lenveloppe ane (plate) dans
lequel celui-ci est pris. La notation anglo-saxonne est ri P, mais ri (relative interior) nest
pas tr`es evocateur en fran cais, si bien que nous avons prefere intr P comme expression
litterale.
22 2. Ensembles convexes
z
t
= (1t)x + ty C

. Comme x C

, il existe r > 0 tel que B(x, r) a C C.


Soit r
t
= (1t)r > 0 et montrons que B(z
t
, r
t
) a C C, ce qui conclura la
demonstration.
Soit z B(z
t
, r
t
) a C. Comme t ,= 1, on peut ecrire
z = (1t)x
0
+ ty, avec x
0
:=
z ty
1 t
. (2.5)
On observe que
|x
0
x| =
1
1 t
|z z
t
| <
r
t
1 t
= r = x
0
B(x, r)
et x
0
=
1
(1t)
z +
t
(1t)
y a C.
D`es lors, x
0
C et (2.5) montre que z C.
Venons-en ` a la seconde partie du lemme. Si x C

, il existe un > 0 tel que


B(x, ) a C C. Alors, pour un t > 1 proche de 1, z := (1t)y + tx B(x, ),
quel que soit y E. Comme z a C lorsque y a C, on en deduit que z C.
La condition est aussi susante. En eet, comme C est non vide, il en est de meme
de C

et on peut choisir y C

. De deux choses lune. Soit y = x, auquel cas x C

et cest termine. Soit y ,= x. Dans ce cas, par hypoth`ese, il existe un t > 1 tel que
z := (1t)y + tx C. Alors x [y, z[, si bien que par la premi`ere partie du lemme,
x C

. 2
On pourra sentraner ` a utiliser ce lemme en demontrant les enonces des exerci-
ces 2.7 et 2.8, mais apr`es avoir vu le resultat suivant qui est tout aussi fondamental.
Proposition 2.8 Soit C un convexe non vide dun espace vectoriel E. Alors
1) son interieur relatif C

est un convexe non vide,


2) son adherence C est un convexe non vide.
Demonstration. 1) Si x, y C

, [x, y] C

dapr`es le lemme 2.7; donc C

est
convexe. Il reste ` a montrer que C

,= .
Si n := dim(a C), on peut trouver n + 1 points x
0
, x
1
, . . . , x
n
de C qui sont
anement independants. Alors tout point x a C peut secrire
x = x
0
+
n

i=1

i
(x
i
x
0
),
avec des coecients
1
, . . . ,
n
R determines de mani`ere unique. Lapplication
: = (
1
, . . . ,
n
) x =
n

i=0

i
x
i
, avec
0
:= 1

n
i=1

i
est un homeomorphisme de R
n
a C. D`es lors, limage par de louvert
2.3. Aspects topologiques 23
:=
_
R
n
:
n

i=1

i
< 1,
i
> 0 pour tout i
_
est un ouvert relatif de a C. Montrons que () C, ce qui conclura la demonstra-
tion. Il sut en fait de constater que
0
0 et que

n
i=0

i
= 1, lorsque .
2) Soient x, y C et t [0, 1]; il faut montrer que (1t)x +ty C. Il existe alors
des suites x
k
x et y
k
y avec x
k
et y
k
C. Le point (1t)x
k
+ty
k
C (par
convexite de C) et converge vers (1t)x + ty, qui appartient donc ` a C. 2
On trouvera ` a lexercice 2.8 dautres informations sur la topologie des ensembles
convexes, qui sont deduites des resultats ci-dessus. Voici pour terminer cette section
quelques r`egles de calcul dinterieurs relatifs et dadherences.
Proposition 2.9 (calcul dinterieurs relatifs et dadherences) Soient E,
E
1
, E
2
et F des espaces vectoriels et A : E F une application lineaire.
1) Si C
1
E
1
et C
2
E
2
sont deux convexes, alors
(C
1
C
2
)

= C

1
C

2
et C
1
C
2
= C
1
C
2
.
2) Si (C
i
)
iI
est une famille de convexes de E telle que
iI
C

i
,= , alors
(
iI
C
i
)


iI
C

i
et
iI
C
i
=
iI
C
i
,
avec egalite ` a gauche si I est ni.
3) Si C E est convexe, alors
(A(C))

= A(C

) et A(C) A(C),
avec egalite ` a droite si A(C) est ferme.
4) Si C F est convexe et si limage reciproque A
1
(C

) ,= , alors
(A
1
(C))

= A
1
(C

) et A
1
(C) = A
1
(C).
5) Si C E est convexe et R, alors
(C)

= C

et C = C.
6) Si C
1
E
1
et C
2
E
2
sont deux convexes, alors
(C
1
+ C
2
)

= C

1
+ C

2
et C
1
+ C
2
C
1
+ C
2
,
avec egalite ` a droite si C
1
+ C
2
est ferme.
Demonstration. Nous utiliserons les resultats enonces ` a lexercice 2.8.
1) La proposition 2.1 montre que a(C
1
C
2
) = (a C
1
) (a C
2
). Par denition
de linterieur relatif et de la topologie produit, (x
1
, x
2
) (C
1
C
2
)

si et seulement
si il existe des ouverts
i
E
i
contenant x
i
(i = 1, 2), tels que
24 2. Ensembles convexes
C
1
C
2
(
1

2
) a(C
1
C
2
)
= (
1

2
) (a C
1
a C
2
)
= (
1
a C
1
) (
2
a C
2
).
Ceci revient ` a dire que (
i
a C
i
) C
i
ou encore que x
i
C

i
. La relation adh(C
1

C
2
) = (adh C
1
) (adh C
2
) est vraie, meme si les C
i
ne sont pas convexes.
2) Soit x
iI
C
i
. Comme il existe un x
0

iI
C

i
, x
t
:= (1t)x
0
+ tx C

i
,
pour tout t [0, 1[ et tout i I (lemme 2.7). Alors x
t

iI
C

i
pour tout t [0, 1[.

A la limite en t 1, on trouve que x = x


1
est dans ladherence de
iI
C

i
. Enn,
puisquune intersection de fermes est fermee, on trouve nalement

iI
C
i

iI
C

i

iI
C
i

iI
C
i
.
On a donc egalite partout, ce qui demontre lidentite sur les adherences. On en deduit
aussi que
iI
C

i
et
iI
C
i
ont la meme adherence et donc le meme interieur relatif
(exercice 2.8 (4)), ce qui conduit ` a linclusion sur les interieurs relatifs :
(
iI
C
i
)

= (
iI
C

i
)


iI
C

i
.
Supposons ` a present que I est ni et que x
iI
C

i
. Soit y
iI
C

i
. Pour tout
i I, on peut trouver un t
i
> 1 tel que y
ti
= (1t)y + tx C
i
. Comme I est ni, il
existe un t > 1 tel que y
t

iI
C
i
. Ceci montre que x (
iI
C
i
)

(lemme 2.7).
3) Linclusion A(C) A(C) decoule de la continuite de A et a lieu meme sans la
convexite de C et sans la linearite de A. De meme pour le cas o` u il y a egalite. Pour
demontrer lidentite sur les interieurs relatifs, on observe dabord que
A(C

) A(C

) = A(C) A(C) A(C

).
On en deduit que A(C) et A(C

) ont la meme adherence, si bien quils ont aussi le


meme interieur relatif (exercice 2.8) : (A(C))

= (A(C

))

A(C

). Pour montrer
linclusion inverse, on utilise le lemme 2.7. Soient y A(C

) et y
0
(A(C))

A(C).
Alors il existe x C

et x
0
C tels que y = Ax et y
0
= Ax
0
. Il existe aussi un t > 1
tel que (1t)x
0
+ tx C. En appliquant A: (1t)y
0
+ ty A(C). On en deduit que
y (A(C))

.
4) On introduit deux ensembles dans E F :
X := E C et L := (x, Ax) : x E.
Par hypoth`ese, il existe un x E tel que Ax C

. Comme X

= E C

, ceci
secrit X

L ,= . On note aussi P
E
: E F E : (x, y) x la projection sur E.
Observons que
A
1
(C) = x E : Ax C = P
E
(X L)
A
1
(C

) = x E : Ax C

= P
E
((E C

) L) = P
E
((X L)

)
A
1
(C) = x E : Ax C = P
E
((E C) L) = P
E
(X L).
Comme P
E
est une application lineaire, on en deduit que (A
1
(C))

= A
1
(C

)
et que adh(A
1
(C)) A
1
(adh C). Legalite a lieu dans la derni`ere relation, car
adh(A
1
(C)) A
1
(adh C), par continuite de A.
2.4. Poly`edres convexes 25
5) Les identites sont claires si = 0. Si ,= 0, lapplication x x est lineaire
bijective et les identites sont des consequences du point 3 (pour ladherence on utilise
C C et C = (C)/ C).
6) On applique le point 3 avec C = C
1
C
2
E
2
et A : E
2
E denie par
A(x
1
, x
2
) = x
1
+ x
2
; puis le point 1. 2
Les identites de la proposition 2.9 sont fondamentales et les hypoth`eses quelles re-
qui`erent se retrouveront sous des formes diverses dans dautres resultats danalyse con-
vexe. Pour simpregner des raisons de leur presence, voici quelques contre-exemples,
tous tr`es simples.
Point 2. Lidentite de gauche est fausse pour les ensembles [0, 1] et [1, 2] dans R: on
trouve 1 , . Elle na pas lieu avec egalite pour la collection innie dintervalles
C
i
= [0, 1+1/i] avec i entier strictement positif : on a (
i
C
i
)

= [0, 1]

= ]0, 1[,
tandis que
i
C

i
= ]0, 1]. Lidentite de droite est fausse pour les ensembles ]0, 1[
et ]1, 2[ dans R: on trouve ,= 1.
Point 3. Lexercice 2.21 donne un exemple dimage de c one convexe ferme par
une application lineaire, qui nest pas fermee. On peut donc ne pas avoir egalite
` a droite.
Point 4. On consid`ere lapplication lineaire A : R R : x 0. Lidentite de
gauche na pas lieu si C = [0, 1] : on trouve (A
1
(C))

= R et A
1
(C

) = .
Celle de droite na pas lieu si C = ]0, 1] : on trouve adh A
1
(C) = tandis que
A
1
(adh C) = R.
Point 6. La somme des convexes fermes C
1
= R
+
0 R
2
et C
2
= (x
1
, x
2
) :
x
2
exp(x
1
) R
2
est lensemble R R
++
, qui nest pas un ferme.
2.4 Poly`edres convexes
On rappelle quun poly`edre convexe dun espace vectoriel E est un ensemble P de la
forme
P = x E : Ax b, (2.6)
o` u A : E R
m
est une application lineaire (m N; si m = 0, P = E), b R
m
et
linegalite Ax b se lit composante par composante dans R
m
: (Ax)
i
b
i
, pour tout
i 1, . . . , m. Si lensemble se presente avec des egalites lineaires Cx = d, on pourra
se ramener ` a la forme (2.6) en les rempla cant par deux inegalites opposees Cx d et
Cx d. Un polytope est un poly`edre convexe borne.
Geometriquement, un poly`edre convexe est donc lintersection dun nombre ni de
demi-espaces de E. Si E est de dimensions nie, il ny a pas de restriction ` a supposer
que E = R
n
et que A est une matrice mn (il sut de se donner une base de E).
Dans certaines circonstances (par exemple en optimisation lineaire, voir le chapi-
tre 17), il est avantageux de representer un poly`edre de R
n
sous la forme dite standard
suivante :
P = x R
n
: Ax = b, x 0. (2.7)
Il ny a aucune perte de generalite dans cette representation. Tout poly`edre de la
forme (2.6) se represente sous la forme (2.7) en introduisant des variables decart
s R
m
et decomposant x = u v, avec u, v R
n
+
:
26 2. Ensembles convexes
(u, v, s) R
n
R
n
R
m
: (A A I)(u

= b, (u, v, s) 0.
Il faut toutefois noter quil faut alors travailler dans un espace de dimension plus
grande. Dautre part, un poly`edre de la forme (2.7) secrit comme en (2.6) en rem-
pla cant Ax = b par les deux inegalites Ax b et Ax b.
Les representations (2.6) et (2.7) dun poly`edre sont dites duales, car elles font
intervenir des applications lineaires (elements du dual de E). Dans la representation
primale dun poly`edre convexe, on ecrit celui-ci comme une somme de combinaisons
convexe et conique delements de E. Si on se donne x
1
, . . . , x
p
E et y
1
, . . . , y
q
E
(on peut prendre les y
j
= 0), lensemble
P = convx
1
, . . . , x
p
+ coney
1
, . . . , y
q
(2.8)
est un poly`edre convexe. Cest ce quarme la proposition 2.16, que nous ne demon-
trerons qu` a la n de cette section. Le choix de la representation dependra du type
de resultat que lon veut obtenir (voir les exercices 2.14 et 2.15).
On rappelle quune arete dun convexe est une face de dimension 1 et quun point
extreme est une face de dimension 0. Un point extreme dun poly`edre convexe P est
aussi appele un sommet. On note ext(P) lensemble des sommets de P. La gure 2.3
montre les dierents types de faces dun poly`edre convexe dans R
2
. Si P est donne
face de dimension 0 (sommet)
face de dimension 1 (arete)
face de dimension 2
Fig. 2.3. Faces dun poly`edre convexe
dans la representation primale (2.8),
ext(P) x
1
, . . . , x
p
,
sans que lon ait necessairement legalite (exercice 2.15). La representation duale per-
met une description plus precise des sommets dun poly`edre. Pour x R
n
, on note
I
+
(x) := i : x
i
> 0 et I
0
(x) := i : x
i
= 0.
Proposition 2.10 (faces et sommets dun poly`edre convexe) Considerons
un poly`edre P represente par (2.7) et un point x P, dont on note F(x) la face
quil engendre. Alors
dimF(x) = dim^
_
A
I
+
(x)
_
,
o` u A
I
+
(x)
est la matrice formee des colonnes A
j
de A avec indices j I
+
(x).
En particulier, x P est un sommet de P si et seulement si les colonnes A
j
:
x
j
> 0 de A sont lineairement independantes.
2.4. Poly`edres convexes 27
Demonstration. Notons B := I
+
(x) et N := I
0
(x). On note alors A
B
(resp. A
N
) la
matrice extraite de A formee de ses colonnes avec indices dans B (resp. N). On fait
de meme pour les vecteurs de R
n
, si bien que x
B
> 0 et x
N
= 0. Le resultat decoule
des equivalences suivantes, dans lesquelles k 1 :
dim^(A
B
) k,
on peut trouver des directions d
1
, . . . , d
k
lineairement independantes
telles que, pour tout i, Ad
i
= 0 et d
i
N
= 0,
on peut trouver des directions d
1
, . . . , d
k
lineairement independantes
telles que, pour tout = (
1
, . . . ,
k
) R
k
voisin de zero, on a x +

k
i=1

i
d
i
P,
on a A(x +

i
d
i
) = b, (x +

i
d
i
)
N
= 0 et (x +

i
d
i
)
B
=
x
B
+

i
d
i
B
0 pour petit (car x
B
> 0),
en prenant = (0, . . . , 0,
i
, 0, . . . , 0) avec [
i
[ petit non nul, la
relation A(x +

i
d
i
) = b implique que Ad
i
= 0; dautre part, la
relation (x +

i
d
i
)
N
0 implique que
i
d
i
N
0 pour [[ petit, ou
encore que d
i
N
= 0,
dimF(x) k.
2
Corollaire 2.11 Un poly`edre non vide represente par (2.7) a au plus
_
n
r
_
som-
mets, o` u r est le rang de A.
Demonstration. Soit
B := B : A
B
est injective et (A
B
) = (A).
Comme les A
B
avec B B sont des sous-matrices extraites de A, de type mr, on a
[B[
_
n
r
_
. Dautre part, chaque choix de B B determine un unique x R
n
tel que
Ax = b et x
i
= 0 pour i / B; donc au plus un sommet x P avec I
+
( x) B. 2
Le nombre de sommets dun poly`edre convexe represente sous forme standard peut
augmenter exponentiellement avec n. Par exemple, le poly`edre convexe de R
2n
ecrit
sous forme standard (on note e un vecteur dont toutes les composantes valent 1)
(x, y) R
2n
: x + y = e, x 0, y 0 a 2
n
sommets.
En eet, ce poly`edre P est une recriture sous forme standard du poly`edre P
0
= x
R
n
: 0 x e. On voit facilement que (x, y) est un sommet de P si et seulement si x
est un sommet de P
0
et y = e x. Comme P
0
=
1
2
(

B

+1) est un translate-contracte


de la boule unite de R
n
pour la norme

, il a 2
n
sommets (exercice 2.10).
Un c one polyedrique convexe est un c one qui est aussi un poly`edre convexe. Comme
poly`edre convexe, il peut secrire sous la forme standard (2.7) et pour que celui-ci soit
un c one, il faut que b = 0 (prendre un point de la forme tx avec t 0). Sous sa forme
standard, un c one polyedrique convexe secrit donc comme suit :
28 2. Ensembles convexes
K = x R
n
: Ax = 0, x 0. (2.9)
Ce c one est dailleurs le c one asymptotique du poly`edre convexe (2.7) : K = P

(exercice 2.14).

Evidemment 0 est un sommet de K et on demontre facilement quil
ny en a pas dautre. Quant aux aretes de K, necessairement de la forme R
+
x avec
x ,= 0, elles sont reperees par le fait que dim^(A
I
+
(x)
) = 1 (proposition 2.10).
Proposition 2.12 (resolution dun poly`edre convexe, Minkowski, 1896)
Soit P un poly`edre convexe donne sous la forme standard (2.7). Alors P peut aussi
secrire
P = convx
1
, . . . , x
p
+ coney
1
, . . . , y
q
,
o` u les vecteurs x
1
, . . . , x
p
(p 1) sont les sommets de P et les demi-droites
R
+
y
1
, . . . , R
+
y
q
(q 1) associees ` a des y
j
non nuls sont les aretes de P

. En
particulier, un poly`edre convexe ecrit sous la forme standard (2.7) a au moins un
sommet.
Demonstration. Linclusion convx
1
, . . . , x
p
+ coney
1
, . . . , y
q
P est evidente,
car si x =

i

i
x
i
+

j

j
y
j
, avec les
i
0, les
j
0 et

i

i
= 1, on voit
facilement que Ax = b et x 0.
Pour linclusion inverse, on commence par montrer que P convx
1
, . . . , x
p
+
P

, o` u les x
i
sont les sommets de P. Soit x P. On proc`ede par recurrence sur
dim^(A
I
+
(x)
).
Si dim^(A
I
+
(x)
) = 0, x est un sommet (proposition 2.10) et le resultat est
clairement demontre.
Supposons que le resultat soit demontre pour les x P tels que dim^(A
I
+
(x)
) =
0, . . . , k 1, avec k 1, et demontrons le lorsque x verie dim^(A
I
+
(x)
) = k.
Comme k 1, on peut trouver une direction d non nulle telle que
d
I
0
(x)
= 0 et Ad = 0.
On envisage trois cas, selon le signe des composantes de d.
Cas 1 Cas 3
x

x
d
x
d
Cas 1 : d 0. Prenons le plus grand
t
> 0 tel que x
t
:= x +
t
d 0. Alors
x
t
P et I
+
(x
t
) I
+
(x). Remarquons que
^(A
I
+
(x

)
) 0
I
+
(x)\I
+
(x

)
^(A
I
+
(x)
)
d
I
+
(x)
^(A
I
+
(x)
), mais d
I
+
(x)
/ ^(A
I
+
(x

)
) 0
I
+
(x)\I
+
(x

)
.
2.4. Poly`edres convexes 29
La derni`ere non-appartenance vient du fait que d a necessairement une com-
posante non nulle avec indice i I
+
(x)I
+
(x
t
) (car x
i
> 0 et x
t
i
= 0). D`es lors
dim^(A
I
+
(x

)
) = dim^(A
I
+
(x

)
) 0
I
+
(x)\I
+
(x

)
dim^(A
I
+
(x)
) 1. Par
recurrence, on a x
t
convx
1
, . . . , x
p
+P

. Comme dautre part, d P

,
le resultat est demontre pour x = x
t
+
t
(d).
Cas 2 : d 0. On sy prend de la meme mani`ere, avec
tt
> 0 le plus grand
possible tel que x
tt
:= x
tt
d 0.
Cas 3 : d , 0 et d , 0. On denit x
t
:= x +
t
d et x
tt
:= x
tt
d, avec
t
> 0
et
tt
> 0 les plus grands possibles tels que x
t
0 et x
tt
0. On a
x =

tt

t
+
tt
x
t
+

t

t
+
tt
x
tt
.
Comme ci-dessus, x
t
et x
tt
convx
1
, . . . , x
p
+P

, et donc il en est de meme


de x qui est une combinaison convexe de x
t
et de x
tt
.
Il reste ` a montrer que P

coney
1
, . . . , y
q
, o` u les y
j
non nuls engendrent les
aretes de P

. Ce resultat est clair si P

= 0. Dans le cas contraire, on consid`ere le


poly`edre convexe P
1
:= y : Ay = 0, e

y = 1, y 0, qui est obtenu en normalisant les


elements de P

(e est un vecteur dont les elements valent tous 1) et qui est non vide.
Clairement P

1
= 0 et donc P
1
est borne. Par ce que lon vient de demontrer, P
1
=
convy
1
, . . . , y
q
, o` u les y
j
sont les sommets de P
1
. Alors P

= R
+
P
1
= coney
1
,
. . . , y
q
. Il reste ` a montrer que les y
j
engendrent les aretes de P

ou encore, dapr`es
la proposition 2.10, que dim^(A
I
+
(y
j
)
) = 1. Dune part dim^(A
I
+
(y
j
)
) 1 car y
j
est non nul et dans ^(A
I
+
(y
j
)
). Dautre part, comme y
j
est un sommet de P
1
,
^
_
A
I
+
(y
j
)
e

I
+
(y
j
)
_
= 0.
Ceci implique que ^(A
I
+
(y
j
)
) 1. 2
Le resultat suivant arme que limage dun poly`edre convexe par une application
lineaire (ou ane) est un poly`edre convexe. Il serait plus simple ` a demontrer si lon
savait dej` a quun ensemble de la forme
convx
1
, . . . , x
p
+ coney
1
, . . . , y
q
,
avec des x
1
, . . . , x
p
E et des y
1
, . . . , y
q
E, est un poly`edre convexe, cest-
` a-dire quil peut secrire sous la forme (2.6) (cette demonstration est proposee ` a
lexercice 2.15), mais nous utiliserons precisement le resultat suivant pour etablir ce
fait ! La demonstration que nous proposons repose sur lelimination de Fourier [143;
1827], qui est sans doute la premi`ere methode pour resoudre un syst`eme dinegalites
lineaires : trouver x R
n
tel que
Ax b. (2.10)
Elle sapparente ` a lelimination gaussienne dans le sens o` u ` a chaque etape elle trans-
forme le syst`eme original en un syst`eme avec de moins en moins dinconnues, mais
contrairement ` a celle-ci, elle nest gu`ere exploitable en pratique car elle requiert tr`es
vite un nombre doperations exponentiel.
30 2. Ensembles convexes
Voyons comment la methode de Fourier elimine x
n
; elle proc`ede de la meme
mani`ere pour les autres variables. On note a
ij
lelement (i, j) de A. Le vecteur x =
(x
1
, . . . , x
n
) est solution du syst`eme dinegalites (2.10) si et seulement si
pour tout i
1
tel que a
i1n
> 0, on a x
n

1
a
i1n
_
_
b
i1

n1

j=1
a
i1j
x
j
_
_
pour tout i
2
tel que a
i2n
> 0, on a x
n

1
a
i2n
_
_
b
i2

n1

j=1
a
i2j
x
j
_
_
pour tout i
3
tel que a
i3n
= 0, on a 0 b
i3

n1

j=1
a
i3j
x
j
.
On peut ` a present eliminer x
n
: x est solution de (2.10) si et seulement si, pour tout i
1
tel que a
i1n
> 0, pour tout i
2
tel que a
i2n
> 0 et pour tout i
3
tel que a
i3n
= 0, (x
1
,
. . . , x
n1
) verie
1
a
i2n
_
_
b
i2

n1

j=1
a
i2j
x
j
_
_

1
a
i1n
_
_
b
i1

n1

j=1
a
i1j
x
j
_
_
0 b
i3

n1

j=1
a
i3j
x
j
.
(2.11)
et x
n
est choisi dans les intervalles denis par le premier jeu dinegalites dans (2.11).
On obtient ainsi un nouveau syst`eme dinegalites lineaires ne portant plus que sur x
1
,
. . . , x
n1
. On peut ensuite eliminer x
n1
, . . . , jusqu` a x
2
, pour nalement obtenir un
dernier jeu dinegalites ne portant que sur x
1
. Le nombre dinegalites crot rapidement
puisquapr`es la premi`ere elimination, on peut en avoir jusqu` a (n/2|)
2
, apr`es la
seconde jusqu` a ((n/2|)
2
/2|)
2
, etc.
Loperation permettant de passer de (2.10) ` a (2.11) est une projection. En fait,
(x
1
, . . . , x
n1
) verie (2.11) si et seulement si il existe un x
n
tel que (x
1
, . . . , x
n1
,
x
n
) verie (2.10). D`es lors, si on introduit le projecteur

n
: R
n
R
n1
: (x
1
, . . . , x
n
) (x
1
, . . . , x
n1
),
lensemble deni par le jeu dinegalites (2.11) nest autre que
n
(P), o` u P est le
poly`edre convexe deni par le jeu dinegalites (2.10). On vient donc de demontrer que

n
(P) est un poly`edre convexe. La proposition suivante va un peu plus loin.
Proposition 2.13 (image dun poly`edre convexe par une application
lineaire) Soient E et F deux espaces vectoriels, T : E F une application
lineaire et P un poly`edre convexe de E. Alors T(P) est un poly`edre convexe
de F.
Demonstration. On peut supposer que E et F sont les espaces vectoriels R
n
et R
p
et que P est de la forme x R
n
: Ax b, o` u A est une matrice de type m n et
b R
m
.
2.4. Poly`edres convexes 31
Premi`ere etape : le resultat est vrai si T est le projecteur (x
1
, . . . , x
p
, . . . , x
n
)
(x
1
, . . . , x
p
). Il sut en fait de composer n p eliminations de Fourier,
p+1

n
, chacune delles transformant un poly`edre convexe en un autre.
Deuxi`eme etape : cas general. Lensemble T(P) = Tx : Ax b peut aussi secrire
(Q), o` u
Q = (y, x) : Ax b, y = T(x)
et : R
p+n
R
p
: (y, x) y est un projecteur. Il est clair que Q est un poly`edre
convexe de R
p+n
et, par la premi`ere etape, il en est de meme de T(P) = (Q). 2
Remarque 2.14 La proposition precedente a un corollaire que nous utiliserons
quelque fois : pour une matrice A et des vecteurs x de dimensions appropriees,
Ax : x 0 est un c one convexe ferme. (2.12)
Le fait que ce soit un c one convexe peut se verier facilement en utilisant les
denitions. Le caract`ere ferme resulte du fait que lorthant positif est un poly`edre
convexe; donc, par la proposition precedente, il en est de meme de Ax : x 0
qui, comme poly`edre convexe, est ferme. On notera, quen general, limage par une
application lineaire dun c one convexe ferme quelconque nest pas necessairement
fermee (exercice 2.21). Dautre part, il faut se garder de confondre (2.12) avec le
fait, trivial lui, que lensemble x : Ax 0 est un c one convexe ferme non vide (il
est ferme parce quil est pre-image de lorthant positif par lapplication continue A).
Larmation (2.12) peut se voir avec un point de vue plus geometrique: lenveloppe
conique dun nombre ni de vecteurs (les colonnes de A) est un ferme. De ce point
de vue, la seconde partie de la proposition 2.16 ci-dessous est un peu plus riche. 2
Voici deux autres consequences de la proposition 2.13.
Proposition 2.15 (existence de solution dun probl`eme doptimisation
lineaire) Soient E un espace euclidien, c E et P un poly`edre convexe non vide
de E. Alors, le probl`eme infc, x) : x P a une solution si linmum est ni.
Demonstration. Soit x
k
P (non vide, par hypoth`ese) une suite minimisante,
veriant donc
c, x
k
) := infc, x) : x P,
qui est ni (par hypoth`ese). On peut supposer que P est ecrit sous la forme standard
(2.7). On introduit lapplication lineaire

A : R
n
R R
m
: x (c, x), Ax).
Alors

Ax
k
est dans le c one convexe

A(R
n
+
), qui est ferme (proposition 2.13 et remar-
que 2.14), et

Ax
k
(, b).
Donc x 0 tel que
(, b) =

Ax = (c, x), Ax).
32 2. Ensembles convexes
On voit que ce x est solution du probl`eme doptimisation considere. 2
Proposition 2.16 (equivalence des representations primale et duale)
Un poly`edre convexe dun espace vectoriel E peut secrire sous la forme (2.8).
Inversement, tout ensemble de la forme (2.8) est un poly`edre convexe.
Demonstration. La premi`ere partie resulte de la proposition 2.12, qui en donne
dailleurs une version plus precise.
Demontrons la seconde partie. Un ensemble de la forme P = convx
1
, . . . , x
p
+
coney
1
, . . . , y
q
peut aussi secrire T(Q), o` u
Q =
_
(, ) R
p
R
q
: 0,
p

i=1

i
= 1, 0
_
et T : R
p
R
q
: (, )

p
i

i
x
i
+

j

j
y
j
. Clairement, lensemble Q est un
poly`edre convexe (ecrit sous forme standard) et T est une application lineaire. Par la
proposition 2.13, P = T(Q) est un poly`edre convexe. 2
2.5 Operations sur les ensembles convexes
2.5.1 Image dun convexe ferme par une application lineaire
Soient E et F deux espaces vectoriels de dimension nie, A : E F une application
lineaire (on pourrait la prendre ane) et C un convexe ferme de E. On cherche
` a savoir quand est-ce que le convexe A(C), image de C par A, est ferme. Un tel
resultat joue un r ole dans la demonstration de lexistence de solution de probl`emes
doptimisation convexes (on vient den voir un exemple avec la proposition 2.15).

Evidemment, si C est compact, A(C) est compact comme image dun compact
par une application continue, donc ferme. Par consequent, cest le comportement
asymptotique de C qui intervient dans le caract`ere non ferme eventuel de A(C) :
on peut parfois trouver une suite x
k
, non bornee, telle que Ax
k
converge vers un
element qui nest pas dans A(C). Cest le cas, par exemple, lorsque C = x R
2
:
x
1
x
2
1 et Ax = x
1
; on trouve que A(C) = R
++
, qui nest pas ferme. Le fait que C
soit un c one convexe ferme, narrange rien (exercice 2.21). Par ailleurs, on sait que
A(C) est ferme dans les situations suivantes :
C est un poly`edre convexe (proposition 2.13),
^(A) C

est un sous-espace vectoriel (exercice 2.16).


Ces deux situations sont loin de les couvrir toutes. Par exemple, aucune de ces hy-
poth`eses nest veriee dans lexemple elementaire suivant : C = x R
2
: x
2
x
2
1

et Ax = x
1
; on trouve que A(C) = R est ferme, alors que C nest pas un poly`edre
convexe et que ^(A) C

= x R
2
: x
1
= 0, x
2
0 nest pas un sous-espace
vectoriel.
Cette question a beaucoup ete etudiee. Une synth`ese assez compl`ete est presentee
dans louvrage dAuslender et Teboulle [22], mais demande de long developpements.
2.5. Operations sur les ensembles convexes 33
Nous nous contenterons ici de couvrir les cas qui nous seront utiles dans la suite. De
mani`ere plus specique, nous allons generaliser la proposition 2.13 a des ensembles
plus generaux que des poly`edres convexes, ` a savoir des ensembles de la forme c
1
(0),
o` u les composantes de c sont quadratiques convexes. Autrement dit C peut etre une
intersection nie densembles de sous-niveaux dapplications quadratiques convexes
(pas seulement anes).
. . .
2.5.2 Projection sur un convexe ferme
Soit E un espace vectoriel euclidien, dont le produit scalaire est note , ) et la norme
associee | |. On sait bien ce quest la projection dun point x de E sur un sous-espace
vectoriel F de E : cest le point x F tel que x x est orthogonal ` a tout vecteur de F;
mais cest aussi le point x F le plus proche de x. Cette derni`ere caracterisation peut
etre utilisee pour denir la projection dun point sur certaines parties de E qui ne
sont pas des sous-espaces vectoriels.
On appelle projection de x sur une partie C de E, toute solution eventuelle du
probl`eme
_
min
1
2
|y x|
2
y C.
(2.13)
Clairement, x est la projection de x si x C. La proposition 2.18 ci-dessous nous
montrera que ce probl`eme a une solution et une seule si C est un convexe ferme non
vide. On la note alors P
C
x et loperateur P
C
: E C est alors appele loperateur de
projection sur C.
Donnons en premier lieu des proprietes qui caracterisent une projection. La
premi`ere, (2.14), nous sera utile dans la demonstration de la proposition 2.18.
x
x = PCx
y
C
Fig. 2.4. Illustration de la proposition 2.17
Proposition 2.17 (caracterisation dune projection) Soit C un convexe
non vide de E. Un point x C est une projection de x E sur C si et seulement
si lune des conditions equivalentes suivantes est veriee :
y C, y x, x x) 0, (2.14)
y C, y x, y x) 0. (2.15)
34 2. Ensembles convexes
Demonstration. Montrons que la projection x est caracterisee par (2.14). Soit y
C. Par convexite de C, z
t
= x+t(y x) C pour tout t ]0, 1]. Comme x est solution
de (2.13), on a
| xx|
2
|z
t
x|
2
= | xx|
2
+ 2t xx, y x) + t
2
|y x|
2
.
Apr`es simplication, division par t > 0 et passage ` a la limite lorsque t 0, on obtient
(2.14). Inversement, en ecrivant y x = (y x) + ( xx) et en utilisant (2.14), on
obtient
|y x|
2
= |y x|
2
+ 2y x, x x) +| x x|
2
| x x|
2
.
Donc x est solution de (2.13).
Montrons lequivalence (2.14) (2.15). Si (2.14) est veriee, on a pour y C :
y x, y x) = |y x|
2
+y x, x x) 0,
cest-` a-dire (2.15). Inversement, en prenant t ]0, 1[ et z
t
= x+t(y x), on a dapr`es
(2.15)
0 z
t
x, z
t
x)
= ty x, ( xx) + t(y x))
= ty x, x x) + t
2
|y x|
2
.
En divisant par t > 0, puis en faisant tendre t vers 0, on trouve (2.14). 2
Avec lapport du chapitre 4, on comprendra que (2.14) nest autre que la condition
necessaire et susante doptimalite (4.8). Ce point de vue permettrait de simplier
la demonstration.
Proposition 2.18 (existence et unicite de la projection) Soient C une
partie convexe fermee non vide dun espace euclidien E et x un point de E.
Alors il existe un unique element x C tel que
y C, | x x| |y x|.
Demonstration. Il sagit de montrer que le probl`eme (2.13) a une solution et une
seule. Existence : elle decoule du corollaire 1.2; C est un ferme non vide et le crit`ere
de (2.13) verie lhypoth`ese de croissance ` a linni (1.2). Unicite : soient x
1
et x
2
deux projections de x sur C; par (2.14), on a
x
2
x
1
, x
1
x) 0 et x
1
x
2
, x
2
x) 0;
en sommant ces deux inegalites, on trouve que x
1
= x
2
. 2
2.5. Operations sur les ensembles convexes 35
Proposition 2.19 (proprietes de la projection) Lapplication projection
x P
C
x sur un convexe ferme non vide C poss`ede les proprietes suivantes :
(i) pour tout x
1
et x
2
E, P
C
x
2
P
C
x
1
, x
2
x
1
) |P
C
x
2
P
C
x
1
|
2
,
(ii) elle est donc monotone : pour tout x
1
et x
2
E, P
C
x
2
P
C
x
1
, x
2
x
1
) 0,
(iii) elle est non-expansive : pour tout x
1
et x
2
E, |P
C
x
1
P
C
x
2
| |x
1
x
2
|.
Demonstration. Dapr`es la caracterisation (2.14) de la projection, on a
P
C
x
2
P
C
x
1
, P
C
x
1
x
1
) 0,
P
C
x
1
P
C
x
2
, P
C
x
2
x
2
) 0.
En sommant ces inegalites, on trouve
P
C
x
2
P
C
x
1
, x
2
x
1
(P
C
x
2
P
C
x
1
)) 0.
Par linegalite de Cauchy-Schwarz :
|P
C
x
2
P
C
x
1
|
2
P
C
x
2
P
C
x
1
, x
2
x
1
) |P
C
x
2
P
C
x
1
| |x
2
x
1
|.
On en deduit le resultat. 2
2.5.3 Separation des ensembles convexes
Un outil essentiel en analyse convexe est le theor`eme de Hahn-Banach sur la separation
des ensembles convexes. On supposera que lespace vectoriel E est de dimension nie.
On peut alors toujours le munir dun produit scalaire, note , ).
La separation des deux convexes se fait geometriquement dans E en utilisant un
hyperplan ane H, cest-` a-dire un ensemble de la forme
H := x E : , x) = t,
o` u E est non nul et t R. On dit que cet hyperplan separe deux convexes C
1
et
C
2
si lon a
x
1
C
1
, x
2
C
2
: , x
1
) t , x
2
).
Ceci sera certainement le cas sil existe un non nul dans E tel que
sup
x1C1
, x
1
) inf
x2C2
, x
2
).
On dit que cet hyperplan separe strictement ces deux convexes sil existe deux scalaires
t
1
et t
2
tels que t
1
< t < t
2
et
x
1
C
1
, x
2
C
2
: , x
1
) t
1
< t
2
, x
2
).
Ceci sera certainement le cas sil existe un (necessairement non nul) dans E tel que
sup
x1C1
, x
1
) < inf
x2C2
, x
2
).
36 2. Ensembles convexes
C
1
C
2

0
x R
n
: , x) = t
Fig. 2.5. Separation de deux convexes
La gure 2.5 illustre cette notion. On a utilise le produit scalaire euclidien sur R
2
.
Lhyperplan x R
2
:

x = t separe strictement les convexes C


1
et C
2
. Cet
hyperplan est determine par le vecteur qui lui est orthogonal.
Nous donnons ci-dessous deux resultats de separation. Le premier arme que lon
peut separer strictement deux ensembles convexes disjoints, si lun est ferme et lautre
est compact. Le second exprime que lon peut separer (non strictement cette fois) deux
ensembles convexes quelconques (en dimension nie).
Theor`eme 2.20 (Hahn-Banach I) Soient C
1
et C
2
deux convexes fermes non
vides disjoints dun espace euclidien E (produit scalaire note , )), tels que leurs
c ones asymptotiques verient C

1
C

2
= 0. Alors on peut separer C
1
et C
2
strictement : il existe un vecteur E tel que
sup
x1C1
, x
1
) < inf
x2C2
, x
2
).
Demonstration. Premi`ere etape. Commen cons par montrer que si C est un convexe
ferme non vide ne contenant pas 0, alors il existe E tel que
inf
xC
, x) > 0.
En eet, il sut de prendre pour C, la projection de 0 sur C (pour le produit
scalaire donne). Dapr`es (2.14), on a pour tout x C : 0 , x ). D`es lors
0 < ||
2
, x), do` u le resultat.
Deuxi`eme etape. Soit C := C
2
C
1
. Cest un convexe non vide (somme de deux
convexes non vides) ne contenant pas 0 (C
1
et C
2
sont disjoints). Montrons que C
est ferme. Soit x
2
k
x
1
k
x, avec x
i
k
C
i
, i = 1, 2. Alors ces suites sont bornees
(en eet, si x
2
k
nest pas bornee, alors, avec t
k
:= |x
2
k
|, on aurait une sous-suite de
x
2
k
/t
k
qui convergerait vers un d C

2
non nul et pour la meme sous-suite x
1
k
/t
k
d;
donc d C

1
C

2
= 0, ce qui contredirait le fait que d ,= 0). En extrayant des
sous-suites convergentes des x
i
k
, on voit que x C; donc C est ferme.
Par la premi`ere etape, il existe t > 0 tel que
x
1
C
1
, x
2
C
2
: , x
2
x
1
) t > 0
ou encore
2.5. Operations sur les ensembles convexes 37
x
1
C
1
, x
2
C
2
: , x
1
) + t , x
2
).
On en deduit le resultat. 2
Le theor`eme precedent sutilise souvent lorsque lun des C
i
est compact (son c one
asymptotique est alors 0 et la condition C

1
C

2
= 0 est trivialement veriee)
ou meme lorsque lun des C
i
est un singleton. Resumons cela sous la forme dun
corollaire.
Corollaire 2.21 Soient C
1
et C
2
deux convexes non vides disjoints dun espace
euclidien E, lun etant ferme et lautre etant compact. Alors on peut separer C
1
et C
2
strictement.
On ne peut pas se liberer de la condition C

1
C

2
= 0 sans modier la con-
clusion du theor`eme 2.20. Par exemple, les deux convexes fermes C
1
= (x, y) R
2
:
y e
x
et C
2
= (x, y) R
2
: y 0 sont disjoints dans R
2
, mais ne peuvent pas
etre separes strictement (observons que C

1
C

2
= (R
+
, 0)).
Le resultat de separation precedent (corollaire 2.21) reste vrai en dimension innie
(on lobtient ` a partir dun resultat de prolongement dapplication lineaire continue et
cest lexistence dune projection qui sen deduit, voir Brezis [65; 1983]). En dimension
innie, il y a un autre resultat permettant de separer deux convexes, non strictement
cette fois. Il faut pour cela que lun des deux soit dinterieur non vide. En dimension
nie, cette hypoth`ese nest pas necessaire : on peut toujours separer deux convexes
quelconques disjoints par un hyperplan ane. Cest ce quarme le theor`eme suivant.
Theor`eme 2.22 (Hahn-Banach II) Soient C
1
et C
2
deux convexes non vides
disjoints dun espace euclidien E (produit scalaire note , )). Alors il existe un
vecteur E non nul tel que
sup
x1C1
, x
1
) inf
x2C2
, x
2
).
Demonstration. La demonstration se fait en deux etapes. On commence par mon-
trer que si C est un convexe non vide ne contenant pas 0, alors il existe un vecteur
E non nul tel que (on na plus linegalite stricte cette fois)
inf
xC
, x) 0.
Pour montrer cela, on se donne une suite x
k

k1
dense dans C (prendre par exem-
ple les points de C dont les coordonnees dans une base sont rationnelles). Soit

C
k
:= convx
1
, . . . , x
k
lenveloppe convexe des k premiers points de la suite. Cest
un convexe ferme non vide ne contenant pas 0 et, dapr`es le theor`eme 2.20, on peut
le separer du convexe compact 0: il existe
k
E tel que
k
, x) > 0 pour tout
x

C
k
. Les
k
etant forcement non nuls, on peut supposer quils sont de norme un
38 2. Ensembles convexes
(prendre
k
/|
k
| si necessaire). Soit alors un point dadherence de
k
(E est de
dimension nie !). Il est non nul. Comme

C
k
est croissante (i.e.,

C
k


C
k+1
),
verie , x
k
) 0 pour tout k 1. Par densite, on obtient , x) 0 pour tout x C.
La deuxi`eme etape se fait comme dans la demonstration du theor`eme 2.20, en
appliquant le resultat de la premi`ere etape ` a C = C
2
C
1
, qui est un convexe non
vide ne contenant pas 0. 2
2.5.4 Enveloppe convexe fermee
Lenveloppe convexe dun ouvert relatif est un ouvert relatif (exercice 2.18), mais len-
veloppe convexe dun ferme nest pas necessairement fermee. Cest le cas par exemple
de la partie fermee de R
2
union de lorigine et de x R
2
: x
(1)
x
(2)
1, dont
lenveloppe convexe (0, 0) x R
2
: x
(1)
> 0, x
(2)
> 0 nest pas fermee (voir la
gure 2.6). La notion suivante a donc tout son sens.
conv P P conv P
Fig. 2.6. Un ensemble P avec son enveloppe convexe conv P qui di`ere de son enveloppe
convexe fermee conv P
Soit P une partie de E. Lintersection de convexes fermes etant un convexe ferme,
on peut parler du plus petit convexe ferme contenant P, qui est donc lintersection de
tous les convexes fermes contenant P. Cest ce que lon appelle lenveloppe convexe
fermee de P. On la note
conv P :=

C : C est un convexe ferme contenant P. (2.16)

Evidemment, si C est un convexe ferme, conv C = C. La proposition suivante donne,


en particulier, une autre mani`ere de denir lenveloppe convexe fermee : cest aussi
ladherence de lenveloppe convexe.
Proposition 2.23 On a
P
1
P
2
= conv P
1
conv P
2
,
P conv P conv P conv P = conv P = conv P.
Demonstration. 1)

Evidemment, P
1
P
2
conv P
2
. Donc, conv P
2
est un convexe
ferme contenant P
1
, si bien que conv P
1
conv P
2
.
2.5. Operations sur les ensembles convexes 39
2) Les deux premi`eres inclusions sont claires. En notant que P est contenu dans
tout convexe ferme contenant P, on a P conv P (par denition de conv P) et donc
aussi conv P conv P (car conv P est convexe). Legalite conv P = conv P se deduit
des observations suivantes : P P implique conv P conv P (premi`ere partie de
la proposition); inversement P conv P (conv P est ferme), donc conv P conv P.
Pour montrer conv P = conv P, on observe dabord que conv P conv P, parce que
ce dernier ensemble est un convexe ferme contenant P (proposition 2.8). Inversement,
conv P conv P et comme ce dernier ensemble est ferme, on a conv P conv P. 2
Voici encore une autre mani`ere de denir lenveloppe convexe fermee. Un demi-
espace ferme de E est un ensemble de la forme
H

(, ) = x E : , x) , (2.17)
o` u E nest pas nul et R. La proposition suivante exprime le fait qu` a droite
dans (2.16), on peut ne selectionner que les demi-espaces fermes.
Proposition 2.24 Lenveloppe convexe fermee dune partie P E est linter-
section de tous les demi-espaces fermes contenant P.
Demonstration. Soit K lintersection de tous les demi-espaces fermes contenant P.
Comme K est un convexe ferme, on a certainement conv(P) K. Inversement, si
x
0
/ conv(P), on peut separer strictement le convexe compact x
0
et le convexe
ferme conv(P) : il existe E et R tels que
x conv(P), , x) < , x
0
).
Donc P H

(, ), i.e., H

(, ) est un demi-espace ferme contenant P, mais x


0
/
H

(, ). Donc x
0
/ K. On a demontre que K conv(P). 2
Corollaire 2.25 Soit C un ensemble convexe. Lintersection de tous les demi-
espaces fermes contenant C est C.
Corollaire 2.26 C est un convexe ferme si et seulement si il est lintersection
de tous les demi-espaces fermes contenant C.
On notera enn que la notion denveloppe convexe fermee napporte rien de neuf
pour un ensemble compact, car son enveloppe convexe est dej` a fermee (elle est com-
pacte).
Proposition 2.27 Lenveloppe convexe dune partie compacte dun espace vec-
toriel de dimension nie est compacte.
40 2. Ensembles convexes
Demonstration. Il est clair que conv P est borne (on utilise la proposition 2.2); il
reste donc ` a montrer quil est ferme. Soit x
k
conv P, avec x
k
x et montrons
que x conv P. Dapr`es le theor`eme de Caratheodory,
x
k
=
n+1

i=1
t
k,i
x
k,i
, (2.18)
avec (t
k,1
, . . . , t
k,n+1
)
n+1
et x
k,i
P. Comme
n+1
et P sont compacts, on
peut extraire de t
k,i

k
et de x
k,i

k
des sous-suites convergentes, dont les limites
sont dans
n+1
et P respectivement. En passant ` a la limite dans (2.18), on voit que
x conv P. 2
2.5.5 C one normal
Soient E un espace euclidien, dont le produit scalaire est note , ), C E un ensemble
convexe et x C. On appelle c one normal ` a C en x lensemble deni par
N
x
C N
C
(x) := d E : d, y x) 0, y C.
Les elements de N
x
C sont appeles des normales ` a C en x.

Evidemment 0 N
x
C,
mais, si x C (la fronti`ere de C), le c one normal nest pas reduit ` a cet element nul.
Il y a une hypoth`ese implicite dans le fait que C ,= , ` a savoir que dimE 1 (Si E
est reduit ` a 0, les seuls ensembles possibles, et 0, nont pas de fronti`ere).
Proposition 2.28 Si x C, alors N
x
C contient un element non nul.
Demonstration. Si x est sur la fronti`ere de C, alors C ,= E et il existe une suite
x
k

k1
EC qui converge vers x. On peut separer C et le singleton x
k
qui sont
des convexes disjoints (theor`eme 2.22) : il existe d
k
non nul tel que
d
k
, x
k
) d
k
, y), pour tout y C.
On peut supposer que d
k
est de norme un et, en extrayant une sous-suite au besoin,
que d
k
d aussi de norme un. En passant ` a la limite dans linegalite ci-dessus, on
voit que le vecteur non nul d est dans N
x
C. 2
2.5.6 C one dual
Soient E un espace vectoriel euclidien, dont le produit scalaire est note , ), et P une
partie de E. On appelle c one dual de P lensemble P

deni par
P

:= x E : x, y) 0, y P.
Cette notion est illustree ` a la gure 2.7, dans laquelle on a utilise le produit scalaire
euclidien de R
2
. Le c one bidual P

de P est lensemble (P

. On denit aussi le
c one dual negatif P

de P, parfois appele c one polaire de P, comme loppose de son


c one dual, cest-` a-dire
2.5. Operations sur les ensembles convexes 41
P
0
P

Fig. 2.7. C one dual P

dun ensemble P de R
2
pour le produit scalaire euclidien
P

:= d E : d, x) 0, x P = P

.
Proposition 2.29 P

est un c one convexe ferme non vide.


Demonstration. P

est clairement non vide (il contient 0). Dautre part, on peut
ecrire P

comme une intersection de c ones convexes fermes :


P

yP
x E : x, y) 0.
2
La demonstration de la proposition suivante est proposee ` a lexercice 2.19.
Proposition 2.30 (c ones dual et bidual) Soient E un espace euclidien; P
et P
i
(i I ensemble dindices quelconque) des parties non vides de E.
(i) (
iI
P
i
)

=
iI
P

i
.
(ii) P

= conv(R
+
P).
(iii) P est un c one convexe ferme si et seulement si P

= P.
La notion de c one dual generalise la notion de sous-espace vectoriel orthogonal,
puisque si P est un sous-espace vectoriel, P

= P

. On connat bien la relation


^(A

= (A), qui nous apprend ce quest le c one dual dun ensemble deni par
des equations lineaires. Une question naturelle est alors de se demander ce quest le
c one dual dun ensemble donne par des inequations lineaires. Le lemme de Farkas
donne une reponse ` a cette question.
42 2. Ensembles convexes
Lemme 2.31 (Farkas [131; 1901]) Soit A une matrice. Alors
y : A

y 0

= Ax : x 0,
o` u ()

designe le c one dual pour le produit scalaire euclidien.


Demonstration. Soit d = Ax avec x 0 et y tel que A

y 0. Alors
d

y = x

y 0,
ce qui montre que d y : A

y 0

.
Inversement, si d y : A

y 0

, on a
d

y 0, y : A

y 0. (2.19)
Supposons que d , Ax : x 0. Comme le dernier ensemble est un convexe ferme
(remarque 2.14) et d est un convexe compact, par le corollaire 2.21 du theor`eme de
Hahn-Banach, il existe R et y
0
tel que
d

y
0
< < x

y
0
, x 0.
En prenant x = 0 ci-dessus, on trouve
d

y
0
< 0. (2.20)
Ensuite en prenant x de la forme tx
0
avec t + et x
0
0, on obtient 0 x

0
A

y
0
.
Comme x
0
0 est quelconque, on obtient
A

y
0
0. (2.21)
(2.20) et (2.21) contredisent (2.19), ce qui conclut la preuve. 2
Le lemme de Farkas permet de donner des conditions necessaires et susantes sur
A et b pour que le syst`eme lineaire Ax = b admette une solution positive x 0 (voir
lexercice 2.22). Ce resultat est aussi connu sous le nom de theor`eme de lalternative.
Corollaire 2.32 Soient A
1
et A
2
deux matrices ayant meme nombre de lignes.
Alors
y : A

1
y = 0, A

2
y 0

= A
1
x
1
+ A
2
x
2
: x
2
0,
o` u ()

designe le c one dual pour le produit scalaire euclidien.


Demonstration. On remplace A

1
y = 0 par A

1
y 0 et (A
1
)

y 0 et on applique
le lemme de Farkas. 2
2.5. Operations sur les ensembles convexes 43
Notes
Hermann Minkowski (1864-1909) fut lun des premiers ` a avoir etudie systematique-
ment les ensembles convexes. Au depart, ce fut dans le but de resoudre des probl`emes
en theorie des nombres, alors que notre presentation est davantage de nature qua-
litative. On lui doit par exemple la proposition 2.12 sur la resolution dun poly`edre
convexe [264; 1896].
La proposition 2.13 a ete etendue ` a des cas beaucoup plus generaux. Ainsi, on peut
montrer que limage par une application lineaire dun ensemble de la forme c
1
(0),
o` u c : R
n
R
m
a ses composantes convexes et als (asymptotically level stable), est
fermee [22; corollaire 3.7.1]. Cette classe de fonctions c
i
inclut celles qui sont convexes
et quadratiques par morceaux (leur domaine est une union nie de poly`edres convexes,
sur chacun desquels la fonction est quadratique [22; proposition 3.3.3]).
Exercices
2.1. Soient un intervalle non vide de R+ et C un convexe. Alors C := |x : , x
C est convexe.
2.2. Enveloppe ane. Soient P et Q des parties dun espace vectoriel E et C une partie
convexe.
1) a(P +Q) = (a P) + (a Q).
2) Si 0 P, a(cone P) = a P.
3) Si C est convexe, a C = |tx + (1t)y : t R, x, y C (comparez avec (2.1)).
2.3. Enveloppe convexe dun nombre ni de convexes. Si P = C1 . . . Cm, o` u les Ci
sont convexes, alors conv P = |
P
m
i=1
tixi : (t1, . . . , tm) m, xi Ci pour tout i
(comparez avec la proposition 2.2).
2.4. Enveloppes convexe et conique dune somme. Soient P et Q deux ensembles dun meme
espace vectoriel. Montrez que
conv(P +Q) = conv P + conv Q
cone(P +Q) cone P + cone Q cone(R+P +R+Q).
En deduire que si P et Q sont des convexes [resp. des c ones convexes], P +Q est un
convexe [resp. un c one convexe].
2.5. Enveloppe conique. Demontrez la proposition 2.4.
2.6. Face dune face. Soit C un convexe et F une face de C. Si F0 est une face de F, alors
F0 est une face de C. En particulier, un point extreme dune face de C est un point
extreme de C.
2.7. Autour du lemme 2.7. Soient C1 et C2 deux convexes tels que C1 C

2
,= . Alors
(C1 a C2)

2
,= .
2.8. Topologie des ensembles convexes. Soit P une partie dun espace vectoriel E. La
fronti`ere relative dun convexe C E est lensemble C \ C

.
1) a P = a P.
2) a P

a P, avec egalite si P

,= (cest le cas si P est convexe).


3) P

P et P

(P)

, avec des egalites si P est convexe.


4) Si C est convexe, alors C

, C et C ont la meme enveloppe ane, le meme interieur


relatif, la meme adherence et la meme fronti`ere relative.
44 2. Ensembles convexes
5) Deux convexes ont le meme interieur relatif si et seulement si ils ont la meme
adherence.
2.9. C one asymptotique.
1) Si |CiiI est une famille quelconque densembles convexes fermes non vides,
dintersection non vide, on a (iICi)

= iIC

i
.
2) Si K est une c one convexe ferme, alors K

= K.
2.10. Points extremes de boules-unite. Dans R
n
, la boule-unite pour la norme 1 a 2n points
extremes et la boule-unite pour la norme en a 2
n
.
2.11. Theor`eme de Birkho [45, 236]. On dit quune matrice G est doublement stochastique
si ses elements sont positifs (Gij 0 pour tout i et j) et si la somme des elements
de chaque ligne et de chaque colonne vaut 1 (
P
i
Gij = 1 pour tout j et
P
j
Gij = 1
pour tout i). On note G
n
lensemble des matrices dordre n doublement stochastiques.
Calculez ext G
n
.
2.12. Face exposee dun convexe. Soit C R
n
un convexe. On dit quune partie E de C est
exposee sil existe c R
n
tel que E = arg min |c

x : x C. Montrez que toute partie


exposee dun convexe est une face, mais que la reciproque est generalement fausse
(elle est vraie dans le cas dun poly`edre convexe, voir lexercice 2.14).
2.13. C ones convexes. Soit K un c one dun espace vectoriel E.
1) K est convexe ssi pour tout x, y K et , R+, on a x +y K.
2) Si K est convexe, x K

, y K, > 0 et 0, alors x +y K

.
3) Si K = cone|x1, . . . , xp, alors a K = vect|x1, . . . , xp et K

= |
P
p
i=1
ixi :
i > 0 pour tout i.
2.14. Poly`edre convexe sous representation duale. Soit P := |x R
n
: Ax = a, Bx b un
poly`edre convexe de R
n
(on suppose les dimensions consistantes). Montrez que :
1) F est une face de P si et seulement si il existe un ensemble dindices I tel que
F = |x P : (Bx b)I = 0;
2) toute face de P est une partie exposee (on sait que la reciproque est vraie pour
un convexe quelconque : toute partie exposee dun convexe est une face, voir
lexercice 2.12);
3) x P est un sommet de P si et seulement si la matrice (A

I
)

formee de la
matrice A et des lignes de B dindices dans I := |i : (Bx b)i = 0 est injective;
4) P

= |d R
n
: Ad = 0, Bd 0;
5) si P0 := |x R
n
: Ax = a, Bx < b est non vide (Bx < b signie (Bx)i < bi
pour tout i), alors a P = |x : Ax = a et P

= P0; donnez un exemple o` u lon


a P0 = ;
6) limage reciproque dun poly`edre convexe par une application lineaire est un
poly`edre convexe.
2.15. Poly`edre convexe sous representation primale. Soit P un poly`edre convexe dun espace
vectoriel E, donne sous la forme P = conv|x1, . . . , xp +cone|y1, . . . , yq, avec des xi
et des yj E. Montrez que :
1) ext(P) |x1, . . . , xp sans que lon ait necessairement legalite;
2) P

= cone|y1, . . . , yq;
3) la somme de deux poly`edres convexes est un poly`edre convexe (donnez la repre-
sentation primale de cette somme);
4) limage dun poly`edre convexe par une application lineaire est un poly`edre con-
vexe.
2.5. Operations sur les ensembles convexes 45
2.16. Image dun convexe par une application lineaire. Soient E et F deux espaces vectoriels
de dimension nie, A : E F une application lineaire et C un convexe ferme non
vide de E. On sait que A(C) est convexe. Montrez que
1) adh(A(C

)) (adhA(C))

,
2) A(A) C

est un sous-espace vectoriel = A(C) est ferme et A(C

) = A(C)

.
2.17. Sous-syst`eme dinegalites lineaires incompatibles. Soit A une matrice de type m n.
Si le syst`eme dinegalites lineaires Ax b na pas de solution, alors il existe un sous-
ensemble dindices I |1, . . . , m tel que [I[ n + 1 et AIx bI na pas non plus
de solution (on a note AI la sous-matrice de A formee des lignes dindices dans I, de
meme pour bI).
2.18. Lenveloppe convexe ouverte. Lenveloppe convexe dune partie relativement ouverte
est relativement ouverte.
2.19. Calcul de c ones duaux. Demontrez la proposition 2.30.
2.20. Exemples de c ones duaux. On dit quun c one K dun espace euclidien est un auto-dual
si K

= K.
1) R
n
+
(orthant positif de R
n
) est auto-dual pour le produit scalaire euclidien de R
n
.
2) R
n

:= |x R
n
: x
2
1
+ + x
2
n1
x
2
n
, xn 0 est auto-dual pour le produit
scalaire euclidien de R
n
.
3) S
n
+
(ensemble des matrices dordre n symetriques semi-denies positives) est auto-
dual pour le produit scalaire A, B) = tr AB de S
n
.
4) Soit R
n

:= |x R
n
: x1 xn le simplexe ordonne de R
n
. Alors, pour
le produit scalaire euclidien de R
n
, on a (R
n

= |d R
n
:
P
j
i=1
di 0, pour
j = 1, . . . , n 1, et
P
n
i=1
di = 0.
2.21. Image lineaire dun c one convexe ferme. On consid`ere le c one convexe ferme K :=
|x R
3
: x
2
1
+ x
2
2
x
2
3
, x3 0 (voir lexercice 2.20) et lapplication lineaire
A : x R
3
R
2
: x (x1, x2 + x3). Montrez que le c one |Ax : x K nest pas
ferme dans R
2
.
Consequence. Limage par une application lineaire dun c one convexe ferme nest pas
necessairement fermee.
2.22. Autour du lemme de Farkas.
1) Theor`eme de lalternative de Farkas [131; 1901]. Soient A une matrice de type
mn et b R
m
. Des deux armations suivantes, une et une seule est vraie : (i)
x 0 : Ax = b, (ii) y : A

y 0 et b

y < 0.
2) Theor`eme de lalternative de Gordan [179; 1873]. Soit A une matrice de type
m n. Des deux armations suivantes, une et une seule est vraie : (i) x 0 :
Ax = 0 et
P
n
i=1
xi = 1, (ii) y : A

y > 0.
3) Variation. Soient A une matrice de type m n et a, b R
m
. Montrez quil
existe un x R
n
tel que a Ax b si et seulement si a

y b

z pour tout
(y, z) R
m
+
R
m
+
tel que A

y = A

z.
4) Eet dune translation. Quel que soit x0, on a
Ax0 +|y : A

y 0

= |Ax : x x0.
5) Generalisation. Soient E et F deux espaces vectoriels munis dun produit scalaire,
A : E F une application lineaire (A

son adjointe) et K un c one convexe ferme


non vide de E (K

son c one dual). Alors


|y : A

y K

= |Ax : x K.
46 2. Ensembles convexes
Extrait de

Elements dOptimisation Dierentiable : Theorie et Algorithmes, J.


Ch. Gilbert (Jean-Charles.Gilbert@inria.fr), ` a paratre. Version du 6 fevrier
2007.
3 Fonctions convexes
The fundamental idea to be understood is that the convex
functions on R
n
can be identied with certain convex subsets of
R
n+1
(their epigraphs), while the convex sets in R
n
can be
identied with certain convex functions on R
n
(their
indicators). These identications make it easy to pass back and
forth between a geometric approach and an analytic approach.
R.T. Rockafellar (1970). Convex Analysis [320].
3.1 Denition
Soit E un espace vectoriel sur R. On note R := R , + la droite achevee.
En optimisation, il est parfois interessant de considerer des fonctions pouvant prendre
des valeurs innies. Par exemple, il peut etre utile de representer un probl`eme dop-
timisation avec contrainte minf(x) : x X, o` u X est une partie de E, par le
probl`eme sans contrainte equivalent min

f(x) : x E, o` u

f prend les memes
valeurs que f sur X et vaut + sur le complementaire de X. Cette astuce permet
de traiter en meme temps les probl`emes avec et sans contraintes et nous lutiliserons
au chapitre 13.
Le domaine dune fonction f : E R est lensemble des points o` u elle ne prend
pas la valeur + (elle peut y prendre la valeur , mais nous considererons le plus
souvent des fonctions ne prenant pas cette valeur). On le note
domf := x E : f(x) < +.
On rappelle que lepigraphe de f est la partie de lespace produit E R qui est
au-dessus de son graphe :
epi f := (x, ) E R : f(x) .
Quant ` a lepigraphe stricte, il est obtenu en prenant linegalite stricte ci-dessus. On
le note
epi
s
f := (x, ) E R : f(x) < .
Denitions 3.1 On dit quune fonction f : E R est convexe si son epigraphe (ou
son epigraphe stricte) est convexe dans E R. On dit que f : E R est concave si
f est convexe.
47
48 3. Fonctions convexes
Le fait quil soit equivalent de prendre lepigraphe ou lepigraphe stricte dans cette
denition est le sujet de lexercice 3.1 (1).
Proposition 3.2 Le domaine dune fonction convexe est convexe. Une fonction
f : E R est convexe si et seulement si pour tout x, y domf et tout t ]0, 1[,
on a
f
_
(1t)x + ty
_
(1t)f(x) + tf(y). (3.1)
Demonstration. Supposons que f soit convexe. Soient x, y domf, t ]0, 1[ et ,
R tels que > f(x) et > f(y) (de tels et existent car x et y domf).
Comme (x, ) et (y, ) sont dans lepigraphe de f, qui est convexe, il en est de
meme de (1t)(x, ) + t(y, ) = ((1t)x + ty, (1t) + t), ce qui se traduit par
f((1t)x + ty) (1t) + t. Comme > f(x) et > f(y) sont arbitraires, on
obtient (3.1). En particulier, ((1t)x + ty) domf; donc domf est convexe.
Supposons ` a present que f : E R + verie (3.1) pour tout x, y domf
et tout t ]0, 1[. Soient (x, ) et (y, ) epi f; donc x et y domf. Dapr`es (3.1),
on a pour t ]0, 1[ : f((1t)x + ty) (1t) + t. Donc (1t)(x, ) + t(y, ) =
((1t)x + ty, (1t) + t) epi f, si bien que epi f est convexe. 2
La signication geometrique de linegalite de convexite (3.1) est claire (voir la
gure 3.1) : pour etre convexe, il faut que, sur tout segment [x, y] domf, f reste
en-dessous de la fonction ane valant f(x) en x et f(y) en y.
y
y
x
+
epi f
epi f
x
non convexe convexe
Fig. 3.1. Denition dune fonction convexe
Denition 3.3 On dit que f : E R + est strictement convexe si pour tout
x, y domf avec x ,= y et pour tout t ]0, 1[ on a
f
_
(1t)x + ty
_
< (1t)f(x) + tf(y).
Sur un espace norme E, on dit que f : E R + est fortement convexe de
module > 0, si pour tout x, y domf et tout t [0, 1], on a

2
t(1t)|x y|
2
+ f
_
(1t)x + ty
_
(1t)f(x) + tf(y).
3.1. Denition 49
Une fonction fortement convexe est donc strictement convexe avec une inegalite de
convexite renforcee par un terme quadratique lui donnant une courbure au moins
egale ` a .
Une fonction identiquement egale ` a +est convexe (son epigraphe est vide), mais
presente peu dinteret. De meme une fonction convexe prenant la valeur est tr`es
particuli`ere (exercice 3.2). Une fonction f : E R ne prenant pas la valeur et
netant pas identiquement egale ` a + est dite propre, sinon elle est dite impropre.
On note
Conv(E)
lensemble des fonctions de E R qui sont convexes et propres. Ce nest pas un espace
vectoriel (la dierence de deux fonctions convexes nest generalement pas convexe !),
ni meme un c one convexe (` a moins que lon ne suppose les fonctions ` a valeurs reelles,
car deux fonctions de Conv(E) peuvent avoir des domaines qui ne sintersectent pas,
auquel cas leur somme est impropre). Si f Conv(E), son epigraphe nest pas vide;
donc linterieur relatif de celui-ci non plus (proposition 2.8). Lexercice 3.1 (2) en
donne une expression explicite :
(epi f)

= (x, ) : x (domf)

, f(x) < . (3.2)


Il sagit donc dune partie de lepigraphe stricte de f.
On dit quune fonction f : E R est fermee si son epigraphe est ferme (il
revient au meme de dire que f est s.c.i.). La gure 3.2 represente ` a gauche une
epi f epi f
x x
f Conv(R) f , Conv(R)
f(x)
f(x)
Fig. 3.2. Fonctions convexes fermee (` a gauche) et non fermee (` a droite)
fonction convexe fermee et ` a droite une fonction convexe non fermee, ne dierant de
la premi`ere que par sa valeur en x. On note
Conv(E)
la partie de Conv(E) formee des fonctions fermees.
Considerons le probl`eme doptimisation suivant :
(P
X
)
_
min f(x)
x X,
dans lequel on cherche ` a minimiser une fonction f denie sur un espace topologique X
` a valeurs dans R + (voir section 1.1). Le resultat suivant donne des conditions
simples assurant lunicite de la solution de (P
X
).
50 3. Fonctions convexes
Theor`eme 3.4 (unicite de solution) Si X est une partie convexe dun espace
vectoriel E et si f est strictement convexe sur X, alors (P
X
) a au plus une
solution.
Demonstration. On raisonne par labsurde. Soient x
1
X et x
2
X deux solutions
distinctes, veriant donc
f(x
1
) = f(x
2
) = min f.
Comme X est convexe et f est strictement convexe sur X, on a
f
_
x
1
+ x
2
2
_
<
1
2
f(x
1
) +
1
2
f(x
2
) = min f.
On aurait donc un point x =
x1+x2
2
appartenant ` a X (car cet ensemble est convexe)
et tel que f(x) < f(x
1
). Ceci contredirait loptimalite de x
1
et x
2
. 2
3.2 Exemples de fonctions convexes
3.2.1 Indicatrice
On appelle fonction indicatrice dune partie P E, ou simplement indicatrice de P,
la fonction 1
P
: E R denie par
1
P
(x) =
_
0 si x P
+ sinon.
Si P est une partie non vide de E, alors 1
P
Conv(E) (resp. 1
P
Conv(E)) si et
seulement si P est convexe (resp. convexe ferme); cest le sujet de lexercice 3.22-(1).
3.2.2 Fonction ane et minorante ane
Une fonction a : E R est dite ane si elle verie pour tout x, y E et tout t R:
a((1t)x + ty) = (1t)a(x) + ta(y).
Ceci revient ` a dire que la fonction x E a(x) a(0) est lineaire. Il sagit
evidemment dune fonction convexe, puisque (3.1) est veriee avec egalite sans con-
dition sur t R. En dimension nie, il ny a pas de restriction ` a supposer que E est
muni dun produit scalaire , ). Une fonction ane est alors donnee par un element
x

E et une scalaire R et secrit


a : x E a(x) = x

, x) + .
Lelement x

, qui represente lapplication lineaire x a(x) a(0) dans E, est appele


la pente de a. On voit que, si lon munit lespace produit E R du produit scalaire
(x, ), (y, )) = x, y) + , lepigraphe de a secrit
3.2. Exemples de fonctions convexes 51
epi a = (x, t) E R : x

, x) + t
= (x, t) E R : (x

, 1), (x, t)) ,


qui nest autre que le demi-espace ferme H

((x

, 1), ) de ER (notation (2.17)).


On appelle minorante ane dune fonction f : E R+, une fonction ane
a qui minore f sur E : pour tout x E, f(x) a(x). Lepigraphe dune minorante
ane de f est donc un demi-espace ferme de E R qui contient lepigraphe de f.
Forcement, si f a une minorante ane, elle ne peut pas prendre la valeur . On
dit quune minorante ane a de f est exacte en x
0
si a(x
0
) = f(x
0
). Dans ce cas, elle
secrit
a(x) = f(x
0
) +x

, x x
0
).
Les fonctions convexes et propres ont des minorantes anes. Cette propriete sera
souvent utilisee, ce qui justie lintroduction de ce concept.
Proposition 3.5 (existence de minorante ane) Toute fonction f
Conv(E) a une minorante ane et celle-ci peut etre choisie exacte en un point
donne de (domf)

. De mani`ere plus precise, si x (domf)

, il existe x

E,
parall`ele ` a a(domf), et R tels que, pour tout y E, on a
f(y) f(x) +x

, y x).
Demonstration. Supposons dabord le domaine de f soit dinterieur non vide et que
x (domf)

. Comme (x, f(x)) est sur la fronti`ere de epi f (les points (x, ) / epi f
si < f(x)), on peut trouver une normale non nulle (x

0
, ) ` a epi f en (x, f(x))
(proposition 2.28, on a muni E R du produit scalaire naturel de lespace produit).
Pour tout (y, ) epi f, on a donc
x

0
, y x) + ( f(x)) 0.
En prenant , on obtient 0. On ne peut avoir = 0, car y = xtx

0
domf
pour t > 0 petit, si bien que lon aurait t|x

0
|
2
0 et donc x

0
serait aussi nul,
contredisant le fait que (x

0
, ) ,= 0. En denissant x

= x

0
/ et en prenant = f(y)
ci-dessus, on obtient pour tout y domf :
f(y) f(x) +x

, y x), (3.3)
montrant lexistence dune minorante ane de f exacte en x.
Si linterieur de domf est vide, on raisonne sur E
0
, lespace vectoriel parall`ele ` a
a(domf), et avec la fonction f
0
: y E
0
f(x+y). Le resultat demontre ci-dessus
permet de trouver un x

E
0
tel que lon ait f
0
(y
0
) f
0
(0) + x

, y
0
), pour tout
y
0
domf
0
= (domf) x. En posant y = x + y
0
, on retrouve (3.3) pour tout
y domf, et donc aussi pour tout y E. 2
3.2.3 Fonction convexe polyedrique
On dit quune fonction f : E R est (convexe) polyedrique si son epigraphe est
un poly`edre convexe. Une fonction polyedrique est donc necessairement convexe et
fermee (elle peut ne pas etre propre cependant).
52 3. Fonctions convexes
(x4, 4)
(y2, 2)
(x3, 3)
(x5, 5)
(1, 1)
(y1, 1)
(x1, 1)
(x2, 2)
(2, 2)
(3, 3)
(4, 4)
Fig. 3.3. Representation primale (` a gauche) et duale (` a droite) dune fonction polyedrique
Selon la representation choisie du poly`edre convexe de E R quest lepigraphe
dun fonction polyedrique f (voir la section 2.4), on obtient une representation primale
ou duale de f. Dans la representation primale (gure 3.3, ` a gauche), epi f secrit
epi f = conv(x
1
,
1
), . . . , (x
p
,
p
) + cone(y
1
,
q
), . . . , (y
q
,
q
),
o` u les x
i
et les y
j
sont donnes dans E et les
i
et
j
sont donnes dans R. Alors
f(x) = inf
_
_
_

1ip
t
i

i
+

1jq
s
j

j
:

1ip
t
i
x
i
+

1jq
s
j
y
j
= x,

1ip
t
i
= 1, t
i
0, s
j
0
_
_
_
. (3.4)
Dans la representation duale (gure 3.3, ` a droite), epi f est vu comme une in-
tersection dun nombre ni de demi-espaces de E R, qui sont des ensembles de la
forme
(x, ) E R :
i
, x) +
i
t
i
,
o` u
i
E,
i
R et t
i
R. Puisque le poly`edre convexe ainsi obtenu doit etre
un epigraphe de fonction, peut y etre pris aussi grand que lon veut, si bien que
les
i
0. Si
i
< 0, le demi-espace est lepigraphe de la fonction ane a
i
: x

i
/
i
, x) + t
i
/
i
. Si
i
= 0, le demi-espace est vertical et la condition
i
, x) t
i
impose ` a x dappartenir ` a un demi-espace de E : le domaine de f est donc un poly`edre
convexe P de E. De ce point de vue, f secrit
f = max
1ik
a
i
+1
P
. (3.5)
Cette representation permet de voir que la somme de deux fonctions convexes
polyedriques est une fonction convexe polyedrique (exercice 3.16).
3.2.4 Pre-composition avec une application ane
Soient E et F deux espaces vectoriels, A : E F une application ane et g : F R.
La composition ou fonction composee de g et A est la fonction notee (g A) : E R,
denie en x E par
3.2. Exemples de fonctions convexes 53
(g A)(x) = g(Ax).
Proposition 3.6 Soient E et F deux espaces vectoriels, A : E F une appli-
cation ane et g : F R une fonction telle que (A) domg ,= .
1) Si g Conv(F), alors g A Conv(E).
2) Si g Conv(F), alors g A Conv(E).
3) Si g est convexe polyedrique, alors g A est convexe polyedrique.
Demonstration. Clairement g A Conv(E) lorsque g Conv(F) et que (A)
domg ,= . Introduisons lapplication ane
B : E R F R : (x, ) (Ax, ).
Alors, (x, ) epi(g A) si et seulement si (Ax, ) epi g, ce qui secrit
epi(g A) = B
1
(epi g).
Si g Conv(F), epi g est ferme, donc aussi B
1
(epi g) = epi(g A), ce qui montre
que g A Conv(E). Si g est convexe polyedrique, epi g est un poly`edre convexe,
donc aussi B
1
(epi g) = epi(g A) (exercice 2.14), ce qui montre que g A est convexe
polyedrique. 2
3.2.5 Enveloppe superieure
Soit I un ensemble quelconque utilise comme ensemble dindices. Pour tout i I,
on suppose donnee une fonction f
i
: E R. On peut alors introduire la fonction
f = sup
iI
f
i
denie pour x E par
f(x) = sup
iI
_
f
i
(x)
_
.
Cette fonction sappelle lenveloppe superieure des fonctions f
i
.
Proposition 3.7 Soit f
i

iI
une famille quelconque de fonctions. Alors
epi
_
sup
iI
f
i
_
=

iI
(epi f
i
) .
On en deduit que :
1) sup
iI
f
i
est convexe si les f
i
sont convexes,
2) sup
iI
f
i
est fermee si les f
i
sont fermees.
Demonstration. En eet (x, ) epi(sup
iI
f
i
) f
i
(x), pour tout i I
(x, ) epi f
i
, pour tout i I (x, )
iI
(epi f
i
). On utilise ensuite le
fait quune intersection de convexes [resp. fermes] est convexe [resp. fermee]. 2
54 3. Fonctions convexes
Il se peut cependant que lenveloppe superieure de fonctions convexes soit identique-
ment egale ` a +, meme si les f
i
Conv(E) (par exemple lenveloppe superieure des
fonctions constantes).
3.2.6 Fonction marginale
Soient E et F deux espaces vectoriels et : E F R une fonction. On associe ` a
cette derni`ere la fonction marginale f : E R denie par :
f(x) = inf
yF
(x, y). (3.6)
Proposition 3.8 1) f est convexe, si est convexe.
2) f Conv(E), si Conv(E F) et si f ne prend pas la valeur .
Demonstration. 1) Lepigraphe stricte epi
s
f est la projection sur ER de epi
s

(E F) R, qui est convexe. Dautre part, limage par une application lineaire dun
convexe est convexe (section 2.1). Donc epi
s
f est convexe.
2) Il reste ` a montrer que f , +. Mais si est propre, il existe un (x, y) tel que
(x, y) < , donc f(x) < . 2
La fonction marginale est une enveloppe inferieure de fonctions convexes x
(x, y), parametrees par y F. On pourrait donc, ` a juste titre, setonner de sa
convexite. Cest evidemment la convexite conjointe sur E F qui permet davoir
cette propriete. En comparaison, dans la proposition 3.7, on ne fait aucune hypoth`ese
sur la structure de lensemble I, ni sur la mani`ere dont f
i
(x) depend de i.
3.2.7 Inf-convolution
Soient f et g deux fonctions E R+, denies sur un espace vectoriel E. Leur
inf-convolution est la fonction (f g) : E R denie par
1
(f g)(x) = inf
yE
_
f(y) + g(xy)
_
= inff(y) + g(z) : y + z = x. (3.7)
Voil` a une operation bien singuli`ere ! Observons dabord quil sagit de la fonction
marginale associee ` a la fonction denie sur E
2
par (x, y) = f(y) + g(xy), si bien
quelle herite des proprietes des fonctions marginales. Dautre part, si la denition
de linf-convolution donnee ci-dessus peut paratre obscure, son expression en termes
depigraphe est particuli`erement simple (la demonstration de la proposition ci-dessous
est proposee ` a lexercice 3.5-(2)).
1
La notation f g nous est propre, mais les autres notations ne sont gu`ere stabilisees :
on trouve f 2g chez Rockafellar [320], f
+

g chez Hiriart-Urruty et Lemarechal [209] et


f g chez Borwein et Lewis [58]. Avec un peu de bonne volonte, le lecteur verra dans
le symbole le fait que lepigraphe (symbole ) stricte de f g est obtenu en sommant
(symbole +) ceux de f et g (proposition 3.9).
3.2. Exemples de fonctions convexes 55
Proposition 3.9 Soient f et g deux fonctions E R +. Alors
epi
s
(f g) = epi
s
f + epi
s
g. (3.8)
En particulier :
1) dom(f g) = domf + domg,
2) commutativite : f g = g f,
3) associativite : (f g) h = f (g h),
4) f g est convexe si f et g sont convexes,
5) f g Conv(E) si f et g Conv(E) et ont une minorante ane commune.
Lidentite (3.8) portant sur les epigraphes strictes na pas lieu si on utilise les
epigraphes, bien que lon ait toujours
epi(f g) epi f + epi g.
Le probl`eme vient du fait que la somme de deux fermes nest pas necessairement
un ferme, si bien que epi f + epi g nest pas necessairement un epigraphe; il peut ne
pas contenir sa fronti`ere inferieure, comme dans lexemple suivant : si f = 1
[0,1[
et
g = Id+1
[0,+[
, alors (x, ) epi f +epi g si et seulement si x 0, 0 et > x1,
si bien que epi f + epi g nest pas lepigraphe dune fonction. Cependant, en prenant
:= f(y) + g(z) dans la denition (3.7) de f g, on a (x, ) = (y, f(y)) + (z.g(z)),
si bien que
(f g)(x) = inf : (x, ) epi f + epi g. (3.9)
3.2.8 Inf-image sous une application lineaire
Soient f : E R une fonction et A : E F une application lineaire. Linf-image de
f sous A est la fonction (f A) : F R denie par
2
(f A)(y) = inf f(x) : x E, Ax = y. (3.10)
Il sagit donc de la valeur minimale de f sur les sous-espaces anes x E : Ax = y
parametres par y. On appellera aussi cette fonction la fonction valeur associee au
probl`eme doptimisation inff(x) : Ax = b, o` u b est donne dans F. Cest un des
interets de cette operation.
En fait, la fonction marginale et linf-convolution peuvent etre vues comme des
linf-images :
2
Lappellation inf-image de f sous A et la notation f A nous sont propres. Rockafel-
lar [320] et Hiriart-Urruty et Lemarechal [209] appellent simplement cette fonction limage
de f sous A, donc sans faire mention de loperation de minimalite qui intervient dans la
denition, ce qui nous a paru dommage. Dautre part, leur notation Af nous semble
etre trop proche dune composition (chez Rockafellar [320], fA est la composition f A,
alors que Af designe linf-image de f sous A). La singularite de cette operation nous a
semble meriter une notation particuli`ere suggerant loperation de minimalite (symbole )
sur des sous-espaces anes (symbole ).
56 3. Fonctions convexes
la fonction marginale de : E F R nest autre que A, o` u A est la
projection de E F sur E,
si f
1
et f
2
: E R, alors
f
1
f
2
= f A, (3.11)
avec f : E E R : et A : E E E denies par
f(x
1
, x
2
) = f
1
(x
1
) + f
2
(x
2
) et A(x
1
, x
2
) = x
1
+ x
2
. (3.12)
Par ailleurs, linf-image apparat dans la conjuguee de la pre-composition dune fonc-
tion convexe avec une application lineaire (proposition 3.34).
Des conditions assurant la convexite de f A sont donnees dans la proposition
suivante. La polyedricite de f A est etudiee ` a la proposition 3.11. Des conditions
pour que f A soit propre et fermee seront donnees ` a la proposition 3.32.
Proposition 3.10 Soient f : E R une fonction convexe et A : E F une
application lineaire. Alors f A est convexe.
Demonstration. Soit B : ER F R lapplication lineaire denie par B(x, ) =
(Ax, ). Montrons que
B(epi
s
f) = epi
s
(f A).
En eet, (y, ) B(epi
s
f) si et seulement si il existe un x E tel que y = Ax et
f(x) < , ce qui revient ` a dire que (f A)(y) < ou encore que (y, ) epi
s
(f A).
Alors la convexite de epi
s
f entrane celle de epi
s
(f A) et donc la convexite de
f A. 2
Proposition 3.11 (inf-image dune fonction convexe polyedrique sous
une application lineaire) Soient f : E R une fonction convexe polyedrique
et A : E F une application lineaire. Alors f A est convexe polyedrique et
linmum dans (3.10) est atteint lorsquil est ni.
Demonstration. On utilise lapplication lineaire B : E R F R de la
demonstration de la proposition 3.10, denie par B(x, ) = (Ax, ). Montrons que
B(epi f) = epi(f A).
En eet,
(y, ) B(epi f)
il existe un x E tel que y = Ax et f(x) ,
(f A)(y) ,
clair,
le probl`eme inff(x) : Ax = y denissant (f A)(y) secrit aussi
3.2. Exemples de fonctions convexes 57
inft : Ax = y, f(x) t; ce dernier consiste ` a minimiser une fonc-
tion lineaire sur un poly`edre convexe non vide (polyedricite de f et
(f A)(y) < +); soit il est non borne, soit il a une solution (propo-
sition 2.15); dans chaque cas limplication est claire; le meme raison-
nement montre que linmum dans la denition de linf-image est atteint
lorsquil est ni,
(y, ) epi(f A).
La polyedricite de f A resulte maintenant du fait que epi f est convexe polyedrique,
donc aussi B(epi f) = epi(f A) (proposition 2.13). 2
3.2.9 Fonction sous-lineaire
Denition 3.12 On dit quune fonction : E R + est sous-lineaire si elle
est convexe et positivement homog`ene de degre 1 (cest-` a-dire : pour tout t > 0 et
tout x E, on a (tx) = t(x)).
Un exemple de fonction sous-lineaire est lapplication d f
t
(x; d), derivee direc-
tionnelle dune fonction convexe en un point x. Nous verrons cela plus loin.
Lappellation sous-lineaire vient de la propriete (iii) de la proposition ci-dessous.
Elle est semblable ` a la condition de convexite (3.1), mais doit avoir lieu ici, meme si
t
1
+ t
2
,= 1.
Proposition 3.13 Soit : E R+ une fonction avec domaine non vide.
Les proprietes suivantes sont equivalentes :
(i) est sous-lineaire;
(ii) epi est un c one convexe de E R;
(iii) (x
1
, x
2
) (dom)
2
et (t
1
, t
2
) R
2
+
, on a (t
1
x
1
+ t
2
x
2
) t
1
(x
1
) +
t
2
(x
2
).
Demonstration. [(i) (ii)] Par denition meme, la convexite de est equivalente
` a la convexite de son epigraphe. Si est sous-lineaire et si (x, r) epi , on a (x) r,
puis (tx) = t(x) tr pour t > 0, donc (tx, tr) epi , qui montre que epi est un
c one. Inversement, si epi est un c one, (tx, t(x)) epi pour tout t > 0, cest-` a-dire
(tx) t(x) pour tout t > 0, donc aussi (x)
1
t
(tx); on en deduit (tx) = t(x)
et lhomogeneite positive de .
[(i) (iii)] Supposons que soit sous-lineaire. Soient (x
1
, x
2
) (dom)
2
et
(t
1
, t
2
) R
2
+
. Alors pour t = t
1
+ t
2
,= 0, on a gr ace ` a lhomogeneite positive et la
convexite de :
(t
1
x
1
+ t
2
x
2
) = t(
t1
t
x
1
+
t2
t
x
2
) t
1
(x
1
) + t
2
(x
2
).
Inversement la condition (iii) implique la convexite de (proposition 3.2) ainsi que,
pour tout t > 0, (tx) = (
t
2
x +
t
2
x) = t(x). 2
58 3. Fonctions convexes
3.2.10 Fonction support
Soit E un espace euclidien (produit scalaire , )). La fonction support dune partie
non vide P E est la fonction
P
: E R + denie par

P
(d) := sup
xP
d, x).
Proposition 3.14 Soient P, P
1
et P
2
des parties non vides de E. Alors
(i)
P
est sous-lineaire et fermee;
(ii)
P1

P2
conv P
1
conv P
2
;
(iii)
P1
=
P2
conv P
1
= conv P
2
;
(iv)
P
=
conv P
=
P
=
conv P
.
Demonstration. [(i)] Il sagit de lenveloppe superieure de fonctions lineaires; celles-
ci etant convexes et fermees, la fonction support est convexe et fermee (proposi-
tion 3.7). Lhomogeneite positive est immediate.
[(ii)] Il sut de montrer que P
1
conv P
2
. Si ce nest pas le cas, il existe
un point x P
1
conv P
2
. On separe strictement le compact x du ferme conv P
2
:
il existe d E et R tels que
x conv P
2
, d, x) < d, x).
On en deduirait que
P2
(d) <
P1
(d). Reciproquement, supposons quil existe
d E tel que
P2
(d) <
P1
(d). Alors P
2
est contenu dans le demi-espace ferme
H

(d, ) := x E : d, x) , mais celui-ci ne contient pas un point de x P


1
.
Alors conv P
2
H

(d, ) et on aurait P
1
, conv P
2
.
[(iii)] Cest une consequence immediate de (ii).
[(iv)] Cest une consequence de (iii) puisque conv P = conv(conv P) = conv P =
conv(conv P). 2
Proposition 3.15 (calcul de fonctions supports) 1) Pour i 1, . . . , m,
on suppose donnes des parties non vides C
i
de E et des scalaires
i
0. Alors

(
P
m
i=1

i
C
i
)
=

m
i=1

i

C
i
.
2) Soient F un espace euclidien, A : E F une fonction lineaire, A

son
adjointe et P une partie non vide de E. Alors, pour tout h F :

A(P)
(h) =
P
(A

h).
Demonstration. 1) Soit d E. On a

(
P
m
i=1

i
C
i
)
(d) = sup
xiCi
d,

m
i=1

i
x
i
) = sup
xiCi
_

m
i=1

i
d, x
i
)
_
.
3.3. Regularite des fonctions convexes 59
Ci-dessus, le supremum est pris sur chaque terme separement, si bien que lon peut
sortir la somme du sup, ce qui conduit au resultat.
2) On a
P
(A

h) = supA

h, x) : x P = suph, Ax) : x P =
A(P)
(h).
2
3.3 Regularite des fonctions convexes
3.3.1 Continuite lipschitzienne
Commen cons par une propriete de continuite lipschitzienne locale.
Lemme 3.16 Si f Conv(E) est bornee (superieurement et inferieurement)
sur un voisinage de E, alors f est localement lipschitzienne sur linterieur de ce
voisinage (tout point de ce voisinage est contenu dans un voisinage sur lequel f
est lipschitzienne).
Demonstration. Par hypoth`ese, il existe un voisinage V et une constante C > 0
tels que [f(x)[ C lorsque x V . Fixons x int(V ) et > 0 tels que

B(x, ) V
et montrons que f est lipschitzienne de module
4C

sur U :=

B(x,

2
).
Soient y, y
t
U, y ,= y
t
, et posons := |y y
t
| ]0, ]. Avec
y
tt
:= y
t
+

2
(y
t
y)

B(x, )
on a
y
t
=
2
2 +
y
tt
+

2 +
y.
Par convexite de f et sa bornitude sur

B(x, ), on obtient alors
f(y
t
)
2
2+
f(y
tt
)+

2+
f(y) = f(y)+
2
2+
(f(y
tt
)f(y)) f(y)+
4C

|y y
t
|.
On obtient le resultat en inversant le r ole de y et y
t
dans linegalite ci-dessus. 2
Les voisinages U sur lesquels f est lipschitzienne sont eventuellement plus petits
que le voisinage V sur lequel elle est bornee et la constante de Lipschitz sur U pourra
etre dautant plus grande que U entoure un point proche du bord de V . Cest le cas
par exemple pour la fonction convexe denie par
_
log x si x > 0
+ si x 0.
Cette fonction nest pas lipschitzienne sur ]0, [, mais lest sur ], [, quel que soit
> 0 (le module de Lipschitz peut y etre pris egal ` a 1/).
Proposition 3.17 (continuite lipschitzienne) Si f Conv(E), alors f est
lipschitzienne sur tout convexe compact inclus dans (domf)

.
60 3. Fonctions convexes
Demonstration. Sans perte de generalite, on peut supposer que le domaine de f est
dinterieur non vide (dans le cas contraire, on travaille sur a(domf), comme dans
la demonstration de la proposition 3.5). Soient n = dimE et K un convexe compact
non vide de (domf)

.
Montrons, en utilisant le lemme 3.16, que pour tout x
0
K, il existe un
0
> 0
et une constante L > 0 tels que B(x
0
,
0
) (domf)

et f est L-lipschitzienne sur


B(x
0
,
0
). Soit x
0
K. Comme dans la demonstration de la proposition 2.8, on peut
construire un simplexe
= convz
0
, z
1
, . . . , z
n
domf, avec x
0

.
D`es lors, il existe
t
0
> 0 tel que B(x
0
,
t
0
) . Alors f est majoree par une cons-
tante M sur cette boule, car tout x secrit x =

n
i=0

i
z
i
avec (
0
, . . . ,
n
)

n+1
, si bien que, par convexite de f, on a
f(x)
n

i=0

i
f(z
i
) =: M.
Par ailleurs, f est aussi minoree inferieurement sur B(x
0
,
t
0
), car elle a une minorante
ane (proposition 3.5). Par le lemme 3.16, il existe un
0
]0,
t
0
] tel que f est
lipschitzienne sur B(x
0
,
0
).
En utilisant la propriete de Heine-Borel pour le compact K, on peut determiner
des points x
1
, . . . , x
p
K, tels quavec les
i
determines comme ci-dessus, les
boules B(x
0
,
i
) recouvrent K et f est L
i
-lipschitzienne sur B(x
0
,
i
). En prenant
L = max(L
1
, . . . , L
p
), on voit que f est L-lipschitzienne sur K. En eet, un segment
[x, y] K sera divise par ces boules en au plus p sous-segments ([x, y] intersecte
chaque boule en un unique sous-segment) sur chacun desquels f est L-lipschitzienne;
en ordonnant ces sous-segments de [x, y], on trouve que [f(y) f(x)[ L|y x|. 2
3.3.2 Dierentiabilite directionnelle
En tout point de son domaine, une fonction convexe admet des derivees directionnelles
suivant toutes directions (on se rappelle que lon na pas besoin de topologie sur E
pour que cette notion de dierentiabilite ait un sens). Cest ce que lon montre avec
la proposition suivante. Dans cette armation, la notion de derivee directionnelle est
prise dans un sens elargi : on accepte les valeurs ou +. Ceci revient ` a dire que
la limite dans
f
t
(x; d) = lim
t0
f(x + td) f(x)
t
,
qui est normalement prise dans R pour les fonctions reelles, est prise ici dans R.
3.3. Regularite des fonctions convexes 61
Proposition 3.18 (dierentiabilite directionnelle) Soient E un espace vec-
toriel et f Conv(E). Alors, pour tout x domf et tout d E :
(i) la fonction
t R
++

f(x + td) f(x)
t
R +
est croissante;
(ii) f
t
(x; d) existe dans R (elle vaut eventuellement ou +);
(iii) f
t
(x; d) vaut + si et seulement si x + td , domf pour tout t > 0;
(iv) si lune des deux derivees directionnelles f
t
(x; d) et f
t
(x; d) vaut
lautre vaut +; si aucune des deux ne vaut , alors
f
t
(x; d) + f
t
(x; d) 0;
Demonstration. [(i)] Soient 0 < t
1
t
2
. Alors, par la convexite de f
f(x + t
1
d) = f
__
1
t
1
t
2
_
x +
t
1
t
2
(x + t
2
d)
_

_
1
t
1
t
2
_
f(x) +
t
1
t
2
f(x + t
2
d).
Do` u
f(x + t
1
d) f(x)
t
1

f(x + t
2
d) f(x)
t
2
.
[(ii) et (iii)] Donc, lorsque t 0 de fa con monotone, la fonction denie en (i)
decrot. Si x + td , domf pour tout t > 0, alors (t) = + et f
t
(x; d) = +. Dans
le cas contraire, la limite (0
+
) existe comme limite dune suite decroissante (et vaut
eventuellement ).
[(iv)] Pour tout t > 0, la convexite de f implique que
f(x) = f
_
x + td
2
+
x td
2
_

1
2
f(x + td) +
1
2
f(x td).
On en deduit (iv) par passage ` a la limite lorsque t 0, apr`es avoir soustrait f(x) aux
deux membres. 2
Le point (iv) de la proposition 3.18 montre que lon peut comparer f
t
(x; d) et
f
t
(x; d) lorsque la fonction f est convexe. Si f nest pas derivable en x, en general
f
t
(x; d) ,= f
t
(x; d). Par exemple, si f(x) = [x[, x R, on a f
t
(0; 1) = f
t
(0; 1) = 1.
Pour x xe dans le domaine de f, la proposition suivante etudie les proprietes de
lapplication derivee directionnelle

x
: d E
x
= f
t
(x; d) R. (3.13)
62 3. Fonctions convexes
Proposition 3.19 (application derivee directionnelle) Soient E un espace
vectoriel, f Conv(E) et x domf. Alors lapplication derivee directionnelle
(3.13) verie les proprietes suivantes :
1)
x
est sous-lineaire,
2) si x (domf)

, alors
a) dom
x
est le sous-epsce vectoriel E
0
de E parall`ele ` a a(domf),
b)
x
Conv(E),
c)
x
est lipschitzienne sur E
0
.
Demonstration. 1) Montrons dabord la convexite de
x
. Soient d
1
, d
2
E et
[0, 1]. Par convexite de f, on a

x
((1)d
1
+ d
2
) = lim
t0
1
t
_
f
_
x + t[(1)d
1
+ d
2
]
_
f(x)
_
= lim
t0
1
t
_
f
_
(1)[x + td
1
] + [x + td
2
]
_
f(x)
_
lim
t0
1
t
(1)f(x + td
1
) + f(x + td
2
) f(x)
= (1)
x
(d
1
) +
x
(d
2
).
Montrons ` a present lhomogeneite positive de degre 1 de
x
. Soit d E et > 0.
On a

x
(d) = lim
t0

f(x + td) f(x)


t
= lim
0
f(x + d) f(x)

=
x
(d).
2) On suppose ` a present que x (domf)

et on note E
0
le sous-espace vectoriel
parall`ele ` a a(domf).
2.a) Si d / E
0
, x + td / domf pour tout t > 0, si bien que
x
(d) = + et
d / dom
x
. Par ailleurs, si d E
0
, x + td domf pour tout t > 0 petit (car
x (domf)

, si bien que
x
(d) < + et d dom
x
.
2.b) La fonction
x
est convexe (point 1) et propre (car son domaine est un sous-
espace vectoriel et que
x
(0) = 0, donc elle ne peut pas prendre la valeur sur
son domaine). Elle est donc localement lipschizienne sur E
0
(proposition 3.17), donc
certainement s.c.i. sur E
0
.
2.c) Dapr`es la proposition 3.17, f est localement lipschizienne sur (domf)

.
Comme x (domf)

, il existe r > 0 tel que f soit lipschitzienne sur B(x, r)


a(domf), disons de module L > 0, Alors pour d E
0
et t > 0 assez petit,
[f(x + td) f(x)[ Lt|d|. En divisant par t > 0 en passant ` a la limite lorsque
t 0, on trouve
d E
0
, [
x
(d)[ L|d|. (3.14)
Soient d
1
et d
2
E
0
. D`es que t 1, la monotonie du quotient dierentiel de la fonc-
tion convexe
x
(proposition 3.18) et lhomogeneite positive de cette meme fonction
assurent que
3.3. Regularite des fonctions convexes 63

x
(d
2
)
x
(d
1
)

x
(d
1
+ t(d
2
d
1
))
x
(d
1
)
t
=
x
_
1
t
d
1
+ d
2
d
1
_

x
_
1
t
d
1
_
.
Comme
x
est continue sur E
0
, lorsque t , le membre de droite converge vers

x
(d
2
d
1
) qui, par (3.14), est majore par L|d
2
d
1
|. En inversant le r ole de d
1
et
d
2
, on obtient [
x
(d
2
)
x
(d
1
)[ L|d
2
d
1
|. 2
3.3.3 Comportement `a linni
Soit f Conv(E). Son epigraphe est alors un convexe ferme non vide. On peut donc
considerer son c one asymptotique (epi f)

. Celui-ci a des proprietes interessantes.


Proposition 3.20 (denition de f

) Soit f Conv(E). Alors


(i) (epi f)

est lepigraphe dune fonction f

: E R +: (epi f)

=
epi f

,
(ii) x domf, d E:
f

(d) = lim
t+
f(x + td) f(x)
t
, (3.15)
(iii) domf

(domf)

,
(iv) f

Conv(E) et est sous-lineaire.


Demonstration. Commen cons par une caracterisation de lappartenance ` a (epi f)

.
Soit x domf (qui est non vide); donc f(x) est ni et (x, f(x)) epi f. Alors
(d, ) (epi f)

(x, f(x)) + t(d, ) epi f, t 0


f(x + td) f(x) + t, t 0. (3.16)
[(i)] Si (d, ) (epi f)

et
t
, (d,
t
) (epi f)

, gr ace ` a (3.16). Fixons ` a


present d E et posons

0
:= inf : (d, ) (epi f)

.
Il faut montrer que (d,
0
) (epi f)

. Dapr`es (3.16)

0
= sup
t>0
f(x + td) f(x)
t
.
On en deduit que f(x + td) f(x) + t
0
, t 0, et donc (d,
0
) (epi f)

(par
(3.16)).
[(ii)] Soit f

la fonction dont (epi f)

est lepigraphe. On a f

(d) =
0
, ou
encore (3.15), car le quotient ci-dessus est croissant avec t (de fait de la convexite
de f).
[(iii)] Dapr`es (3.16), si d domf

, (d, f

(d)) (epi f)

et f(x + td) +
tf

(d), qui est ni quel que soit t 0. Donc d (domf)

.
64 3. Fonctions convexes
[(iv)] Dune part, f

est convexe fermee et non identiquement egale ` a +, parce


que son epigraphe est le convexe ferme non vide (epi f)

. Dautre part, f

ne prend
pas la valeur car sa valeur est obtenue comme limite dune suite croissante (voir
(3.15)). Enn f est sous-lineaire, car son epigraphe est un c one convexe (proposi-
tion 3.13). 2
Deux remarques sur ce resultat.
Si x domf et f(x + td) = + pour un t > 0, alors d / (domf)

et donc
d / domf

(par (iii)), cest-` a-dire f

(d) = +.
On notera que lon na pas necessairement egalite au point (iii) de la proposition
precedente. En eet, si f : R R est lexponentielle, on a f

(1) = . Donc
1 , domf

, alors que 1 (domf)

= (R)

= R.
Denition 3.21 On appelle fonction asymptotique (ou fonction de recession) de f
Conv(E) la fonction f

Conv(E) introduite dans la proposition 3.20.


La formule (3.15) montre que si la fonction t f(x + td) a une asymptote ` a droite,
f

(d) en est sa pente, sinon f

(d) = +. Dautre part, f

(d) = + sil existe un


t > 0 tel que f(x +td) = +. Enn, dapr`es la proposition 3.18, on sait que, lorsque
x domf, le quotient de la formule (3.15) crot avec t; il converge vers f

(d) si
t + et vers f
t
(x; d) si t 0. Cette notion est illustree ` a la gure 3.4.
PSfrag replacements
f1
f2
f3
f

1
f

2
f

3
Fig. 3.4. Exemples de fonctions convexes (en haut) et de leur fonction asymptotique (en
bas); de gauche ` a droite : f1(x) = (x
2
+ 10)
1/2
, f2(x) = log x et f3(x) = x +e
x
On note lensemble de sous-niveau R dune fonction f : E R de la mani`ere
suivante :
N

(f) := x E : f(x)
Cest un ensemble convexe, lorsque f est convexe. La notion de fonction asymptotique
est tr`es utile, du fait du resultat suivant, qui montre que pour les fonctions de Conv(E)
3.3. Regularite des fonctions convexes 65
ces ensembles de sous-niveau ont tous le meme c one asymptotique (sils sont non
vides). En particulier, si lun est borne non vide, ils sont tous bornes (eventuellement
vides). Un de ces ensembles de sous-niveau est lensemble de ses minimiseurs:
arg min f := x E : f(x) f(x
t
), x
t
E = N
inf f
(f).
La fonction asymptotique permet alors de donner des conditions necessaires et su-
santes pour que lensemble des minimiseurs soit non vide et borne. Dautres condi-
tions, ne faisant pas intervenir f

et valables pour les fonctions de Conv(E), sont


donnees ` a lexercice 3.27.
Proposition 3.22 (ensembles de sous-niveau dune fonction convexe)
Soit f Conv(E). Alors pour tout R tel que N

(f) ,= , on a
(N

(f))

= d E : f

(d) 0. (3.17)
En particulier, les proprietes suivantes sont equivalentes:
(i) R tel que N

(f) est non vide et borne,


(ii) arg min f est non vide et borne,
(iii) R, N

(f) est borne,


(iv) d E 0, f

(d) > 0.
Demonstration. Soient R et x N

(f) suppose non vide. Alors


d (N

(f))

f(x + td) , t 0.
Donc si d (N

(f))

, f

(d) 0 par passage ` a la limite ci-dessus (apr`es avoir divise


par t > 0). Inversement, si f

(d) 0, f(x +td) f(x), pour tout t > 0 (le quotient


dans (3.15) est croissant et borne par 0). Alors x N

(f) implique que x+td N

(f),
pour tout t > 0; donc d (N

(f))

.
Lequivalence des proprietes (i)-(iv) se deduit facilement de (3.17). 2
3.3.4 Fermeture
Proposition 3.23 (denition de la fermeture) Soit f : E R une fonction
(non necessairement convexe). Alors adh(epi f) est lepigraphe dune fonction

f : E R:
epi

f = epi f.
Demonstration. Il faut dabord montrer que si (x, ) adh(epi f) et > , alors
(x, ) adh(epi f). Dans ce cas, il existe alors une suite de couples (x
k
,
k
) epi f
convergeant vers (x, ). Alors, pour k assez gand,
k
et donc (x
k
, ) epi f. En
passant ` a la limite, on trouve que (x, ) adh(epi f).
Il faut ensuite montrer que si (x,
k
) adh(epi f) et
k
, on a (x, )
adh(epi f). Ceci se deduit directement du fait que adh(epi f) est ferme. 2
66 3. Fonctions convexes
La fonction

f denie par la proposition 3.23 est appelee la fermeture de f.
Proposition 3.24 (proprietes de la fermeture) Soit f : E R une fonc-
tion (non necessairement convexe) et

f sa fermeture. Alors
(i)

f est fermee et

f f,
(ii) pour tout x dom

f,

f(x) = liminf
yx
f(y) := lim
0
inf
yb(x,)
f(y), (3.18)
(iii) en x domf, f(x) =

f(x) si et seulement si f est s.c.i. en x.
Demonstration. [(i)] Lepigraphe de

f etant ferme,

f est fermee. Par ailleurs

f f
car epi

f epi f.
[(ii)] Comme

f est fermee et

f f,

f(x) = liminf
yx

f(y) liminf
yx
f(y).
Inversement, il existe une suite de couples (x
k
,
k
) epi f convergeant vers (x,

f(x)).
Comme f(x
k
)
k
,

f(x) = lim
k

k
liminf
k
f(x
k
) liminf
yx
f(y).
[(iii)] Si f(x) =

f(x), on voit par (3.18) que f est s.c.i. en x. Inversement, si f
est s.c.i. en x, f(x) liminf
yx
f(y) =

f(x) [par (3.18)] f(x) [car

f f], donc
f(x) =

f(x). 2
Proposition 3.25 (enveloppe superieure de minorantes anes) Soit f
Conv(E). Alors

f est lenveloppe superieure des minorantes anes de f.
Demonstration. Soit a
i

iI
la famille des minorantes anes de f. On cherche ` a
montrer que

f = sup
iI
a
i
ou en terme depigraphe :
epi

f =

iI
epi a
i
.
Lepigraphe de f etant un convexe, le corollaire 2.25 nous apprend que epi

f =
adh(epi f) est lintersection de tous les demi-espaces fermes de E R contenant
epi f. Comme lepigraphe dun a
i
est un demi-espace ferme contenant epi f, on a
dej` a linclusion epi

f
iI
epi a
i
. Pour montrer linclusion inverse, il sagit decrire
les demi-espaces fermes contenant epi f au moyen des epigraphes des a
i
.
Un demi-espace ferme de E R est deni par un triplet (, , t) E R R; on
le note H

(, , t) := (x, ) : , x) + t. Sil contient epi f il faut que lon ait


(x, ) epi f : , x) + t.
On a necessairement 0 (on peut prendre aussi grand que lon veut dans
linegalite ci-dessus). Si < 0, H

(, , t) est lepigraphe de la minorante ane de f


suivante x /, x) + t/ (prendre = f(x) ci-dessus).
Que faire des demi-espaces fermes de la forme H

(, 0, t) ? Par hypoth`ese, f
Conv(E); elle a donc une minorante ane (proposition 3.5), dont lepigraphe est un
certain H

(
0
,
0
, t
0
), avec
0
< 0. Si lon etablit que
3.4. Conjuguee 67
H

(, 0, t) H

(
0
,
0
, t
0
) =

0
H

(
0
+ ,
0
, t
0
+ t),
on aura termine la demonstration, puisque lon aura exprime lintersection des demi-
espaces fermes contenant epi f comme lintersection des epi a
i
. Cette identite resulte
en fait de lequivalence triviale
, x) t et
0
, x) +
0
t
0
0 :
0
+ , x) +
0
t
0
+ t.
2
3.4 Conjuguee
Soit f : E R + une fonction, non necessairement convexe. Nous allons dans
cette section lui associer une autre fonction f

: E R +, appelee conjuguee
de Fenchel de f. Elle est construite explicitement ` a partir de f. Cette construction
peut paratre abstraite et arbitraire au premier abord, mais elle est utile ` a plus dun
titre :
nous verrons ` a la section 3.4.2 quen reiterant le processus de conjugaison, on a
un moyen analytique de convexier f,
la conjuguee de Fenchel peut aussi etre utilisee comme outil intermediaire dans
le calcul de sous-gradient, un concept generalisant la notion de gradient pour les
fonctions convexes non-dierentiables, que nous verrons ` a la section 3.5,
enn la conjuguee de Fenchel permet aussi dintroduire un probl`eme doptimisa-
tion dual dun autre probl`eme doptimisation (section 13.2).
On supposera que E est un espace euclidien, dont le produit scalaire est note , ).
3.4.1 Conjuguee de Fenchel
Comme nous le signalions ci-dessus, la notion de fonction conjuguee intervient dans
la denition du sous-dierentiel dune fonction convexe f. On verra que le sous-
dierentiel f(x) de f en x est lensemble des pentes des minorantes anes de f
exactes en x. Pour x donne, il nest pas toujours aise de specier toutes ces mino-
rantes anes. Il est parfois plus facile de se donner une pente x

dune minorante
ane x x

, x) + et de chercher les points auxquels elle est exacte. De ce point


de vue, illustre ` a la gure 3.5, on cherche le plus grand tel que
x E : x

, x) + f(x) ou x

, x) f(x) .
On voit clairement que la plus petite valeur de est donnee par
f

(x

) := sup
xE
_
x

, x) f(x)
_
. (3.19)
Cest la valeur de la conjuguee de f en x

. On sest interesse ` a plut ot qu` a


pour denir f

dans le but dobtenir ainsi une fonction conjuguee convexe. Cette


68 3. Fonctions convexes
x
pente x

R f
f

(x

)
0
Fig. 3.5. Interpretation de f

(x

)
propriete remarquable de la conjuguee (on se rappelle que f nest pas necessairement
convexe) sera demontree ` a la proposition 3.27. Revenons au probl`eme que nous nous
posions au debut de ce paragraphe : si x est solution du probl`eme en (3.19), alors
x

, x) f(x) x

, y) f(y) pour tout y E ou encore


f(y) f(x) +x

, y x), y E,
ce qui montre que y f(x) + x

, y x) est une minorante ane de f, exacte


en x. D`es lors, les sous-dierentiels de f aux points-solutions du probl`eme en (3.19)
contiennent x

.
Denition 3.26 Soit f : E R une fonction (non necessairement convexe). Sa
fonction conjuguee f

: E R est la fonction prenant en x

E la valeur donnee
par (3.19). Lapplication f f

est appelee transformation de Legendre-Fenchel.


Il est interessant didentier les cas o` u la fonction conjuguee est non triviale
(domf

,= ) et o` u elle ne prend pas de valeur indesirable (f

(x

) ,= ). On
a les implications symetriques suivantes :
x
0
: f(x
0
) R = f

a une minorante ane = domf ,= (3.20)


x

0
: f

(x

0
) R = f a une minorante ane = domf

,= . (3.21)
Ces implications se demontrent facilement. Ainsi, si f(x
0
) R, quel que soit x

E,
on a f

(x

) x

, x) f(x
0
), si bien que x

, x) f(x
0
) est une minorante
ane de f

. Dautre part, si domf = , alors f

et f

ne peut avoir de
minorante ane. Considerons ` a present les implications de (3.21). Si f

(x

0
) R,
+ > f

(x

0
) x

0
, x) f(x) pour tout x E, si bien que x x

0
, x) f

(x

0
) est
une minorante ane de f. Dautre part, si x x

0
, x) + est une minorante ane
de f, f

(x

0
) = supx

0
, x) f(x) , si bien que x

0
domf

, qui nest pas vide.


Du fait de ces implications, on est souvent amene ` a faire lhypoth`ese suivante sur
les fonctions dont on veut calculer la conjuguee.
La fonction est propre et a une minorante ane. (3.22)
3.4. Conjuguee 69
Dapr`es la proposition 3.5, lhypoth`ese (3.22) a lieu pour les fonctions de Conv(E).
La convexite de f

mise en evidence par la proposition ci-dessous est remarquable;


on se rappelle en eet que f nest, elle, pas necessairement convexe.
Proposition 3.27 Soit f : E R+ une fonction veriant (3.22). Alors,
f

Conv(E) (i.e., f

est convexe, fermee et propre).


Demonstration. En eet, f

secrit comme le supremum de la famille indicee par


x E des fonctions anes (donc convexes) et continues (donc fermees) x

, x)
f(x). On en deduit que f

est elle-meme convexe et fermee (proposition 3.7). La


conjuguee ne prend pas la valeur car domf ,= . Enn, f , +, car f a une
minorante ane. 2
3.4.2 Biconjuguee
Si f : E R + verie (3.22), le domaine de f

nest pas vide (proposition


3.27). De plus, pour x domf, on a linegalite
f

(x

) x

, x) f(x), x

E,
ce qui veut dire que f

a une minorante ane (la fonction x

E x

, x) f(x)) :
lhypoth`ese (3.22) est veriee pour la fonction conjuguee. On peut donc reiterer le
processus de conjugaison et denir la fonction biconjuguee de f : E R+, qui
est la fonction f

: E R + denie pour x E par


f

(x) = sup
x

E
_
x

, x) f

(x

)
_
.
En appliquant la proposition 3.27 ` a f

, on voit que
f

Conv(E).
Si largument x

de f

est une forme lineaire (identiee ` a un element de E au


moyen du produit scalaire , )), largument x de f

est dans lespace de depart E.


On peut alors se demander sil y a un lien entre f et f

. La proposition suivante
examine cette question.
Proposition 3.28 (enveloppe convexe fermee) Soit f : E R+ une
fonction veriant (3.22). Alors
1) sa biconjuguee f

est lenveloppe superieure des minorantes anes de f,


en particulier f

f,
2) f Conv(E) = f

=

f (la fermeture de f),
3) f Conv(E) f

= f,
4) la transformation de Legendre-Fenchel f f

est une bijection sur lensem-


ble Conv(E).
70 3. Fonctions convexes
Demonstration. 1) Soit x E. La valeur en x de lenveloppe superieure des mino-
rantes anes de f secrit
sup
x

E, R
x

,y)+f(y), yE
_
x

, x) +
_
= sup
x

E
sup
R
x

,y)+f(y), yE
_
x

, x) +
_
= sup
x

E
_
x

, x) f

(x

)
_
= f

(x).
2) Si f Conv(E),

f est lenveloppe superieure des minorante anes de f (propo-
sition 3.25), cest-` a-dire f

dapr`es le point 1.
3) Si f Conv(E), epi f = adh(epi f) [car epi f est ferme] = epi

f [par denition
de

f] = epi f

[par le point 2, donc f = f

. Inversement, legalite f

= f implique
que f est convexe et fermee (car f

Conv(E)).
4) Dapr`es la proposition 3.27, la transformation de conjugaison ( : f f

est bien
denie sur Conv(E) et est de toute fa con ` a valeurs dans Conv(E). Elle est injective,
car si f
1
et f
2
Conv(E) sont telles que f

1
= f

2
, on a f

1
= f

2
et donc f
1
= f
2
dapr`es le point 3. Elle est surjective, car si g Conv(E), on a ((g

) = g

= g
dapr`es le point 3; donc g est limage de g

par (. 2
Corollaire 3.29 Si f Conv(E) et x domf, alors f(x) = f

(x) si et seule-
ment si f est s.c.i. en x.
Demonstration. Dapr`es la proposition 3.24, lorsque x domf, on a f(x) =

f(x)
si et seulement si f est s.c.i. en x. Le resultat est alors une consequence du fait que

f = f

lorsque f Conv(E). 2
Dapr`es la proposition 3.28, il est naturel dappeler aussi la biconjuguee f

,
lenveloppe convexe fermee de f. La gure 3.6 donne la biconjuguee de la fonction
representee ` a la gure 3.5.
x
R
f
f

0
Fig. 3.6. Fonction biconjuguee
3.4. Conjuguee 71
La proposition suivante montre quil ne sert ` a rien de reiterer le processus de
conjugaison au-del` a du second ordre : la tri-conjuguee se confond avec la conjuguee.
Proposition 3.30 (triconjuguee) Soit f : E R + une fonction
veriant (3.22). Alors (f

= f

.
Demonstration. Dapr`es la proposition 3.28, f

f et donc (f

(exer-
cice 3.17-(3)). Inversement, pour x

xe, f

(x) x

, x) f

(x

) pour tout x E,
et donc
(f

(x

) = sup
xE
_
x

, x) f

(x)
_
f

(x

).
2
3.4.3 Calcul de fonctions conjuguees
Inf-image sous une application lineaire
Rappelons la denition de linf-image f A dune fonction f sous une application
lineaire A, introduite ` a la section 3.2. On se donne deux espaces euclidiens E et F
(on aura besoin ici dun produit scalaire sur E et F, alors que cette structure nest
pas necessaire dans la denition de f A), une fonction f : E R et une application
lineaire A : E F. Alors f A : F R est denie en y F par
(f A)(y) = inf
xE
Ax=y
f(x). (3.23)
Nous donnons ` a la proposition 3.31 lexpression de la conjuguee de f A. La propo-
sition 3.32 enonce des conditions assurant que f A est dans Conv(F) ou Conv(F).
Proposition 3.31 (conjuguee dune inf-image sous une application line-
aire) Si f : E R + verie (3.22) et si lapplication lineaire A : E F
verie
(A

) domf

,= ,
alors f A verie (3.22) et
(f A)

= f

. (3.24)
Demonstration. Clairement f A , + (elle prend une valeur nie sur A(domf),
qui nest pas vide). Dautre part, par hypoth`ese, il existe un x

0
:= A

0
domf

.
Alors linegalite + > f

(x

0
) x

0
, x) f(x) valable pour tout x E conduit ` a
+ > f(x) y

0
, Ax) (f

)(y

0
), pour tout x domf.
72 3. Fonctions convexes

Evidemment (f A)(y) = + si y / A(domf). Soit ` a present y A(domf). En


prenant linmum ci-dessus pour les x domf veriant Ax = y, on trouve
(f A)(y) y

0
, y) (f

)(y

0
), pour tout y F.
D`es lors f A a une minorante ane et verie donc (3.22).
Pour y

F, on trouve
(f A)

(y

) = sup
yF
_
_
y

, y) inf
xE
Ax=y
f(x)
_
_
= sup
(x,y)EF
Ax=y
_
y

, y) f(x)
_
= sup
xE
_
A

, x) f(x)
_
= f

(A

).
2
Proposition 3.32 (proprete et semi-continuite inferieure dune inf-ima-
ge sous une application lineaire) Soient E et F deux espaces euclidiens,
f : E R une fonction et A : E F une application lineaire.
1) Si f Conv(E) et si A verie (A

) domf

,= , alors f A Conv(F).
2) Si f Conv(E) et si A verie (A

) (domf

,= , alors f A
Conv(F). De plus, linmum dans (3.23) est atteint lorsquil est ni.
Demonstration. 1) Comme f Conv(E), f A est convexe (proposition 3.10).
Dautre part, comme f : E R + verie (3.22) (proposition 3.5) et que
(A

) domf

,= , f A verie aussi (3.22) (proposition 3.31). Donc f A


Conv(F).
2) Pour montrer que f A est fermee, on suppose que lon a des suites y
k
F
et
k
R telles que
(f A)(y
k
)
k
, y
k
y et
k
.
Il sut de montrer que (f A)(y) . Dapr`es la denition de f A, on peut trouver
une suite
k
0 et une suite x
k
E telles que
f(x
k
)
k
+
k
, Ax
k
= y
k
, y
k
y et
k
.
Il sagit de passer ` a la limite dans ces relations.
La suite x
k
netant pas necessairement bornee, on cherche ` a construire une
autre suite x
k
E, bornee elle, qui laisse inchanges f et A. Si on se donne x

1

(A

) domf

, qui est non vide par hypoth`ese, il revient au meme dimposer


f( x
k
) x

1
, x
k
) = f(x
k
) x

1
, x
k
) et A x
k
= Ax
k
,
3.4. Conjuguee 73
puisqualors f( x
k
) = f(x
k
) (en eet x

1
(A

) et A x
k
= Ax
k
impliquent que
x

1
, x
k
) = x

1
, x
k
)). Remarquons que f() x

1
, ) = f

() x

1
, ) nest autre
que la conjuguee

de la fonction Conv(E) denie par (x

) := f

(x

+ x

1
).
Comme 0 dom, E
0
:= a dom est un sous-espace vectoriel. Soit x
k
la projection
orthogonale de x
k
sur E
0
(A

). Dune part, x
k
x
k
(A

= ^(A), si bien
que A(x
k
) = A( x
k
). Dautre part, x
k
x
k
E

0
, si bien que

(x
k
) = sup
x

E0
x

, x
k
) (x

) = sup
x

E0
x

, x
k
) (x

) =

( x
k
).
On a donc
f( x
k
)
k
+
k
, A x
k
= y
k
, y
k
y et
k
.
Si x
k
est bornee, on peut en extraire une sous-suite convergente, disons vers x.
Par semi-continuite inferieure de f, on a f( x) liminf f( x
k
). En passant ` a la limite
ci-dessus, on a
f( x) et A x = y.
Donc (f A)(y) et (f A) est fermee.
Remarquons que si lon prend ci-dessus y
k
= y et
k
= (f A)(y), pour tout k, la
suite x
k
devient une suite minimisante du probl`eme de minimisation dans (3.23).
Le raisonnement ci-dessus montre alors que ce probl`eme a une solution.
Il reste donc ` a montrer que x
k
est bornee. Observons que x
k
E
1
:= E
0

(A

) = vect(dom (A

)). D`es lors, pour montrer que x


k
est bornee, il sut
de monter que, quel que soit z E
1
, z, x
k
) est bornee (par labsurde : on prend
pour z, un point dadherence de x
k
/| x
k
|). Soit donc z E
1
. Par hypoth`ese, 0
(domf

(A

) = (domf

(A

))

= (dom (A

))

, puisque domf

=
dom x

1
et que x

1
(A

). Donc tz dom (A

) pour t > 0 assez petit :


il existe x

dom et y

F tels que tz = x

. En introduisant v

tel que
x

1
= A

, on trouve
tz, x
k
) = x

, x
k
) A

, x
k
)
(x

) +

( x
k
) y

, A x
k
)
= (x

) +

(x
k
) y

, Ax
k
)
= (x

) + f(x
k
) y

+ v

, Ax
k
)
(x

) +
k
+
k
y

+ v

, y
k
),
dont le membre de droite est borne (il converge vers (x

) +y

+v

, y) R). 2
Pre-composition avec une application lineaire
Dapr`es la proposition 3.6, si A : E F est une application lineaire et si g Conv(F)
verie (A) domg ,= , alors g A Conv(E), si bien que (g A)

= g A.
On sinteresse ci-dessous au calcul de la biconjuguee (g A)

lorsque la fonction
g Conv(F) nest pas necessairement fermee, mais verie une condition plus forte
que la condition minimale (A) domg ,= assurant la proprete de g A.
74 3. Fonctions convexes
Proposition 3.33 (biconjuguee dune pre-composition avec une appli-
cation lineaire) Soient E et F deux espaces vectoriels, A : E F une applica-
tion lineaire et g Conv(F) une fonction veriant (A) (domg)

,= . Alors
g A Conv(E) et
(g A)

= g

A.
Demonstration. On a dej` a vu que g A Conv(E). Comme dans la demonstration
de la proposition 3.6, on introduit lapplication lineaire
B : E R F R : (x, ) (Ax, )
qui permet decrire epi(h A) = B
1
(epi h), quel que soit la fonction h : F R.
Dapr`es (3.2) et gr ace ` a la condition de proprete renforcee (A) (domg)

,= :
B
1
((epi g)

) = B
1
_
(y, ) : y (domg)

, g(y) <
_
= (x, ) : Ax (domg)

, g(Ax) <
,= .
Ensuite
epi((g A)

) = epi(g A), [proposition 3.28, point 2]


= B
1
(epi g)
= B
1
(epi g), [proposition 2.9 et B
1
((epi g)

) ,= ]
= B
1
(epi g

)
= epi(g

A).
On a donc bien etabli que (g A)

= g

A. 2
Proposition 3.34 (conjuguee dune pre-composition avec une applica-
tion lineaire) Soient E et F deux espaces euclidiens, A : E F une applica-
tion lineaire et g Conv(F).
1) Si g Conv(F) et si (A) domg ,= , alors g A Conv(E) et
(g A)

= (g

. (3.25)
2) Si g est convexe polyedrique et si (A) domg ,= , alors
(g A)

= g

. (3.26)
De plus, linmum dans la denition de (g

)(x

) est atteint sil est ni.


3) Si g Conv(F) et si (A) (domg)

,= , alors g A Conv(E) et (3.26)


a lieu. De plus, linmum dans la denition de (g

)(x

) est atteint sil


est ni.
3.4. Conjuguee 75
Demonstration. 1) Dapr`es la proposition 3.6, gA Conv(E). On applique alors la
proposition 3.31 avec f := g

et A := A

(ses hypoth`eses sont veriees, car g

= g) :
(3.24) donne (g

= g A, qui par conjugaison conduit ` a (3.25).


2) Si g est convexe polyedrique et si (A) domg ,= , alors, dapr`es le point 1,
on a (3.25). Mais g

est convexe polyedrique (exercice 3.16) et donc aussi g

(proposition 3.11), qui est donc fermee. Alors (3.25) donne (3.26). La proposition 3.11
nous apprend aussi que linmum dans la denition de (g

)(x

) est atteint sil


est ni.
3) Dapr`es la proposition 3.6, g A Conv(E). On peut appliquer le point 1 avec
g := g

Conv(F), car (A) domg

(A) (domg

= (A) (domg)

[selon lexercice 3.18 (2)] ,= [par hypoth`ese]. Ceci donne


(g

A)

= (g

.
Dapr`es la proposition 3.33 et gr ace ` a lhypoth`ese (A) (domg)

,= , g

A =
(gA)

, si bien que (g

A)

= (gA)

. Dautre part, dapr`es la proposition 3.32 (2)


avec f := g

et A := A

et gr ace au fait vu ci-dessus que (A) domg

,= , on
voit que g

est fermee (donc (g

= g

) et que linmum denissant


g

est atteint lorsquil est ni. 2


Inf-convolution
Une inf-convolution peut se voir comme une inf-image sous une application lineaire,
voir (3.11)(3.12). En appliquant la proposition 3.31 ` a cette inf-image, on obtient le
resultat suivant.
Proposition 3.35 (conjuguee de linf-convolution) Soient f
1
, . . . , f
p
:
E R + des fonctions propres telles que

1ip
domf

i
,= .
Alors f
1
f
p
verie la condition (3.22) et
(f
1
f
p
)

= f

1
+ + f

p
.
Demonstration. On applique donc la proposition 3.31. On sait que f
1
f
p
=
f A, avec f : E
p
R + et A : E
p
E denies par
f(x
1
, . . . , x
p
) = f
1
(x
1
) + + f
p
(x
p
) et A(x
1
, . . . , x
p
) = x
1
+ + x
p
.
Exiger la proprete de f revient ` a demander celle des f
i
. Dautre part, f verie (3.22)
si et seulement si les f
i
verient (3.22). On peut alors calculer f

et A

(la somme des


f

i
(x

i
) ci-dessous peut valoir +, mais on est s ur de ne pas additionner +et ) :
f

(x

1
, . . . , x

p
) = f

1
(x

1
) + + f

p
(x

p
) et A

(x

) = (x

, . . . , x

).
Enn la condition (A

)domf

,= secrit
i
domf

i
,= . En conclusion, f
1

f
p
verie la condition (3.22) et (f
1
f
p
)

= (f A)

= f

= f

1
+ +f

p
. 2
76 3. Fonctions convexes
Somme
Proposition 3.36 (conjuguee dune somme) Soient f
1
, . . . , f
p
: E R
+ des fonctions.
1) Si les f
i
Conv(E) et
i
domf
i
,= , alors f
1
+ + f
p
Conv(E),
f

1
f

p
Conv(E) et
(f
1
+ + f
p
)

= (f

1
f

p
)

. (3.27)
2) Si les f
i
Conv(E) et
i
(domf
i
)

,= (on peut remplacer (domf


i
)

par
domf
i
dans cette condition si f
i
est polyedrique), alors f
1
+ + f
p

Conv(E), f

1
f

p
Conv(E) et
(f
1
+ + f
p
)

= f

1
f

p
. (3.28)
De plus, linmum dans la denition de (f

1
f

p
)(x

) est atteint lorsquil


est ni.
Demonstration. 1) Supposons que les f
i
Conv(E) et que
i
domf
i
,= . Les
fonctions f

i
verient bien les hypoth`eses demandees sur les f
i
dans la proposition 3.35.
On en deduit que f

1
f

p
verie (3.22) et que (f

1
f

p
)

= f
1
+ +f
p
. Donc
f
1
+ +f
p
Conv(E) (proposition 3.27) et f

1
f

p
Conv(E) (f

1
f

p
est
aussi convexe par la proposition 3.9). En prenant la conjuguee de la derni`ere identite,
on obtient (3.27).
2a) Si toutes les fonctions f
i
sont convexes polyedriques et que lon a seulement

i
domf
i
,= , le point 1 et lexercice 3.16 donnent le resultat enonce au point 2.
En eet, dans ce cas, les f
i
Conv(E) comme fonctions convexes polyedriques, les
f

i
Conv(E) comme conjuguees de fonctions convexes polyedriques et f

1

f

p
Conv(E) comme inf-convolution de fonctions convexes polyedriques. De plus
linmum dans la denition de (f

1
f

p
)(x

) est atteint lorsquil est ni.


2b) Supposons ` a present que les f
i
Conv(E) et que
i
(domf
i
)

,= . On
se ram`ene ` a la proposition 3.34 (point 2) en ecrivant f
1
+ + f
p
= g A, avec
g Conv(E
p
) et A : E E
p
lineaire, denies par
g(x
1
, . . . , x
p
) = f
1
(x
1
) + + f
p
(x
p
) et A(x) = (x, . . . , x).
Il faut verier que (A) (domg)

,= . On a (A) = (x, . . . , x) : x E et
(domg)

= (domf
1
domf
p
)

= (domf
1
)

(domf
p
)

(proposition 2.9),
si bien que (A) (domg)

= (x, . . . , x) : x (domf
1
)

(domf
p
)

, qui est
non vide par hypoth`ese. D`es lors f
1
+ + f
p
Conv(E) et
(f
1
+ + f
p
)

(x

) = (g A)

(x

) = (g

)(x

) = inf
x

1
,...,x

p
E
A

(x

1
,...,x

p
)=x

(x

1
, . . . , x

p
).
De plus, linmum ci-dessus est atteint lorsquil est ni. On verie aisement que
g

(x

1
, . . . , x

p
) = f

1
(x

1
) + + f

p
(x

p
) et que A

(x

1
, . . . , x

p
) = x

1
+ + x

p
, ce qui
permet de conclure.
3.4. Conjuguee 77
2c) Considerons ` a present le cas mixte o` u les f
i
Conv(E), o` u f
1
, . . . , f
k
sont
polyedriques (0 < k < p) et o` u (
1ik
domf
i
) (
k+1ip
(domf
i
)

) ,= . On note
g
1
= f
1
+ + f
k
et g
2
= f
k+1
+ + f
p
.
Dapr`es les points 2a et 2b, on a
g

1
(y

1
) = inf f

1
(x

1
) + + f

k
(x

k
) : x

1
+ + x

k
= y

2
(y

2
) = inf f

k+1
(x

k+1
) + + f

p
(x

p
) : x

k+1
+ + x

p
= y

2
,
avec des bornes inferieures atteintes lorsquelles sont nies. Il sut donc de montrer
que
(g
1
+ g
2
)

(x

) = inf g

1
(y

1
) + g

2
(y

2
) : y

1
+ y

2
= x

(3.29)
et que la borne inferieure est atteinte si elle est nie, car alors
(f
1
+ + f
p
)

(x

) = (g
1
+ g
1
)

(x

)
= inf
y

1
+y

2
=x

_
g

1
(y

1
) + g

2
(y

2
)
_
(3.30)
= inf
y

1
+y

2
=x

_
inf
x

1
++x

k
=y

1
_
f

1
(x

1
) + + f

k
(x

k
)
_
+ inf
x

k+1
++x

p
=y

2
_
f

k+1
(x

k+1
) + + f

p
(x

p
)
_
_
= inf
x

1
++x

p
=x

_
f

1
(x

1
) + + f

p
(x

p
)
_
.
De plus, si (f
1
+ +f
p
)

(x

) est ni, linmum en (3.30) est atteint par des y

i
(cest
ce que lon demontrera), si bien que les g
i
(y

i
) sont nis et les autres bornes inferieures
sont egalement atteintes. Montrons donc (3.29) et larmation qui suit.
On note /
2
:= a domg
2
. Clairement, domg
1
=
1ik
domf
i
et (domg
2
)

=
(
k+1ip
domf
i
)

=
k+1ip
(domf
i
)

, car cette derni`ere intersection est sup-


posee non vide (proposition 2.9). Alors (domg
1
) (domg
2
)

,= , par hypoth`ese. Il
en decoule (voir lexercice 2.7)
(/
2
domg
1
)

(domg
2
)

,= .
On voit que lon peut appliquer le point 2b aux fonctions
h
1
= g
1
+1
,2
Conv(E)
et g
2
, qui ont un point commun dans linterieur relatif de leur domaine. Comme
g
1
+ g
2
= h
1
+ g
2
, on trouve
(g
1
+ g
2
)

(x

) = (h
1
+ g
2
)

(x

) = inf
z

1
+z

2
=x

_
h

1
(z

1
) + g

2
(z

2
)
_
,
avec un inmum atteint sil est ni. On peut aussi calculer h

1
par le point 2a, car g
1
et 1
,2
sont polyedriques (exercice 3.16) et ont des domaines qui sintersectent :
h

1
(z

1
) = inf
y

1
+z

=z

1
_
g

1
(y

1
) +1

,2
(z

)
_
,
78 3. Fonctions convexes
avec un inmum atteint sil est ni. En injectant ci-dessus, on trouve
(g
1
+ g
2
)

(x

) = inf
y

1
+z

+z

2
=x

_
g

1
(y

1
) +1

,2
(z

) + g

2
(z

2
)
_
,
avec un inmum atteint sil est ni. On peut maintenant regrouper les deux derniers
termes, car 1
,2
Conv(E) et g
2
Conv(E) ont un point commun dans linterieur
relatif de leur domaine ((dom1
,2
)

= /
2
(domg
2
)

) :
g

2
(y

2
) = (1
,2
+ g
2
)

(y

2
) = inf
z

+z

2
=y

2
_
1

,2
(z

) + g

2
(z

2
)
_
,
avec un inmum atteint sil est ni. On conclut
(g
1
+ g
2
)

(x

) = inf
y

1
+y

2
=x

_
g

1
(y

1
) + inf
z

+z

2
=y

2
_
1

,2
(z

) + g

2
(z

2
)
_
_
= inf
y

1
+y

2
=x

_
g

1
(y

1
) + g

2
(y

2
)
_
,
avec un inmum atteint sil est ni. 2
3.5 Sous-dierentiabilite
La notion de derivee est fondamentale en analyse car elle permet dapprocher lo-
calement des fonctions par des mod`eles lineaires, plus simples ` a etudier. Ces mod`eles
fournissent des renseignements sur les fonctions quils approchent, si bien que de nom-
breuses questions danalyse passent par letude des fonctions linearisees (stabilite,
inversibilite locale, etc). On rencontre beaucoup de fonctions convexes qui ne sont
pas differentiables au sens classique (voir lannexe C pour un rappel sur le calcul
dierentiel). Pour celles-ci, on dispose toutefois de la notion de sous-differentiel qui
peut jouer un r ole similaire ` a celui de la derivee des fonctions plus reguli`eres, plus
lisses. Nous la developpons dans cette section.
Le sous-dierentiel est un substitut de la notion de gradient pour les fonctions
convexes non dierentiables (section 3.5.1). Ce nest plus un vecteur de E comme
le gradient, mais un sous-ensemble de E qui nest reduit ` a un point quen cas de
G ateaux dierentiabilite (proposition 3.48). Nous lintroduirons ` a partir des derivees
directionnelles, dont on sait quelles existent toujours pour les fonctions convexes
(proposition 3.18). Lapplication derivee directionnelle est en fait la fonction support
du sous-dierentiel (proposition 3.45), un concept deni ` a la section 3.2.10. Les r`egles
de calcul de sous-dierentiel se ram`enent d`es lors parfois aux r`egles de calcul de
fonctions supports (proposition 3.15).
Une fonction convexe est sous-dierentiable si son sous-dierentiel est non vide
(denition 3.38). La propriete de sous-dierentiabilite sexprime donc sous la forme
de resultat dexistence. Applique ` a la fonction valeur dun probl`eme doptimisation
cela impliquera lexistence de multiplicateurs optimaux (section 4.6.1) et donc de
solutions dun autre probl`eme doptimisation, le probl`eme dual (chapitre 13). On
dispose donc l` a dune methode originale pour montrer quun probl`eme doptimisation
3.5. Sous-dierentiabilite 79
a une solution: il sut de montrer quil est le dual dun probl`eme dont la fonction
valeur est sous-dierentiable en zero (cette technique sera par exemple utilisee pour
etablir le theor`eme 13.15).
Dans cette section, on suppose que lon travaille sur un espace euclidien E, dont
le produit scalaire est note , ).
3.5.1 Sous-dierentiel
Dans cette section, on se donne une fonction f : E R+ convexe avec domaine
non vide, cest-` a-dire
f Conv(E).
On rappelle que ces fonctions ont aussi une minorante ane et donc f

Conv(E)
(proposition 3.27). On rappelle egalement, quen tout point de son domaine, une
fonction convexe admet une derivee directionnelle suivant toute direction, celle-ci
pouvant eventuellement prendre les valeurs ou + (proposition 3.18).
La notion de sous-dierentiabilite est fondee sur la proposition suivante.
Proposition 3.37 (denitions du sous-dierentiel) Soient f Conv(E),
x domf et x

E. Alors les proprietes suivantes sont equivalentes :


(i) d E : f
t
(x; d) x

, d),
(ii) y E : f(y) f(x) +x

, y x),
(iii) f(x) + f

(x

) = x

, x) (ou ).
Demonstration. [(i) (ii)] Par convexite de f et (i) avec d = y x, on obtient
(ii) :
y E : f(y) f(x) + f
t
(x; y x) f(x) +x

, y x).
[(ii) (iii)] On recrit (ii) comme suit :
y E : x

, x) f(x) x

, y) f(y). (3.31)
En prenant le supremum en y E ` a droite, on obtient (iii), car on a toujours
f(x) + f

(x

) x

, x).
[(iii) (i)] On part de lexpression (3.31) de (iii), qui avec y = x + td devient
f(x + td) f(x) x

, td).
Apr`es division par t > 0 et passage ` a la limite lorsque t 0, on obtient (i). 2
Denition 3.38 On dit quune fonction f Conv(E) est sous-dierentiable en un
point x domf sil existe x

E veriant les proprietes equivalentes (i)(iii) de la


proposition 3.37. Ces elements x

sont appeles les sous-gradients de f en x. Lensemble


des sous-gradients de f en x est appele le sous-dierentiel de f en x. Cet ensemble
est note f(x). Par convention, f(x) = si x / domf.
80 3. Fonctions convexes
Chacune des trois conditions equivalentes (i)(iii) de la proposition 3.37 re`ete
un aspect particulier du sous-gradient. La condition (i) nous apprend quun sous-
gradient est la pente dune minorante lineaire de
x
() = f
t
(x; ), exacte en 0. Selon
la condition (ii), un sous-gradient est la pente dune minorante ane de f, exacte
en x. Enn, (iii) nous informe que x

est un sous-gradient de f en x si la plus grande


minorante ane de f de pente x

, qui est lapplication y E x

, y) f

(x

) (voir
la discussion au debut de la section 3.4.1), est exacte en x. Le sous-dierentiel f(x)
se calcule parfois plus facilement en commen cant par calculer la fonction conjuguee f

puis en utilisant la relation (iii); des exemples sont donnes dans les exercices 3.23,
3.24 et 3.25.
La gure 3.7 illustre la denition du sous-dierentiel.
`
A gauche, on a represente
PSfrag replacements
1
1
1
1
2
f
f
PSfrag replacements
1
2
f
f
x1
x1 +f(x1)
x2
x2 +f(x2)
x3
x3 +f(x3)
Fig. 3.7. Representations du sous-dierentiel
la fonction f : R R denie par f(x) = max(x, x
2
) (en haut) et lapplication
multivoque x R f(x) T(R) (en bas). Comme on le verra ` a la proposi-
tion 3.48, f(x) ne se distingue de f(x), le gradient de f en x, quen des points de
non-dierentiabilite, cest-` a-dire ici aux points x = 0 et x = 1. Dapr`es la propo-
sition 3.37 (ii), en un tel point x, f(x) est lensemble des pentes x

telles que
y f(x) +x

, yx) minore f sur R. Ainsi f(0) = [0, 1] et f(1) = [1, 2].


`
A droite
sont representees les courbes de niveau dune fonction f : R
2
R, qui est le max-
imum de trois fonctions quadratiques convexes. Les courbes en tirets sont les lieux
de non dierentiabilite, que lon rep`ere par les coins quy font les courbes de niveau.
On les appelle les plis de f. Au point x
1
, la fonction est dierentiable et le sous-
dierentiel f(x
1
) se confond avec le vecteur gradient f(x
1
) (proposition 3.48), que
lon a represente ici apr`es avoir translate lorigine en x
1
. En x
2
et x
3
la fonction
nest pas dierentiable. Les sous-dierentiels en ces points sont alors les enveloppes
convexes des vecteurs gradients des fonctions quadratiques actives en ces points :
f(x
2
) est un segment et f(x
3
) est un triangle. Les sous-dierentiels representes ` a
la gure 3.7 sont polyedriques, mais il nen est pas toujours ainsi. Par exemple, le
sous-dierentiel en zero de la norme
2
dans R
n
est la boule unite associee ` a cette
norme (exercice 3.23-(3)).
3.5. Sous-dierentiabilite 81
Voici quelques corollaires de la proposition 3.37.
Corollaire 3.39 (optimalite) Soit f Conv(E). Un point x E minimise f
sur E si et seulement si 0 f( x).
Demonstration. Cest une consequence immediate de la proposition 3.37 (ii) : si
x minimise f on peut prendre x

= 0 dans (ii), donc 0 f(x); inversement, si


0 f(x), x

= 0 dans (ii) montre que x minimise f. 2


Selon ce corollaire, trouver un minimiseur de f sur E revient ` a trouver les zeros
de f(). On rapprochera ce fait du resultat selon lequel, lorsque f est convexe
dierentiable, les minimiseurs de f sont les zeros de son application gradient f().
Corollaire 3.40 (sous-dierentiel de la derivee directionnelle) Soit x
domf et
x
lapplication derivee directionnelle denie en (3.13). Alors
f(x) =
x
(0).
Demonstration. Comme
x
(0) = 0, cette relation se deduit de lequivalence entre
les points (i) et (ii) de la proposition 3.37. 2
Corollaire 3.41 (sous-dierentiels de f et f

)
1) Si f Conv(E), alors x

f(x) = x f

(x

).
2) Si f Conv(E), alors x

f(x) x f

(x

).
Demonstration. 1) Si x

f(x), on a f(x) + f

(x

) = x

, x) (proposition
3.37 (iii)). Comme f

f (proposition 3.28), on a aussi, f

(x) +f

(x

) x

, x),
ce qui exprime le fait que x f

(x

) (proposition 3.37 (iii)).


2) Lorsque f Conv(E), f = f

(proposition 3.28). Le resultat se deduit alors


du point (iii) de la proposition 3.37. 2
La reciproque na pas lieu au point 1, pour la fonction f Conv(R) ci-dessous
f(x) =
_
_
_
0 si x < 0
1 si x = 0
+ si x > 0
donc f

(x

) =
_
+ si x < 0
0 si x 0,
puisque lon a 0 / f(0) = , alors que 0 f

(0) = ] , 0].
82 3. Fonctions convexes
Corollaire 3.42 (sous-dierentiels de f et f

) Soient f Conv(E) et x
domf. Alors
1) f(x) f

(x),
2) f(x) ,= = f(x) = f

(x),
3) f(x) = f

(x) = f(x) = f

(x).
Demonstration. 1) Si x

f(x), alors f(x) + f

(x

) = x

, x) (proposition
3.37 (iii)), donc f

(x) +(f

(x

) x

, x) car f

f (proposition 3.28, point 1)


et (f

= f

(proposition 3.30), si bien que x

(x) (proposition 3.37 (iii)).


2) On a toujours f

(x) f(x) (proposition 3.28, point 1). Dautre part, si x


f(x), on a par denition de f

et par la proposition 3.37 (iii) :


f

(x) x

, x) f

(x

) = f(x).
3) Dapr`es le point 1, il reste ` a montrer linclusion f

(x) f(x). Si x

(x), on a f

(x) + (f

(x

) = x

, x). En utilisant lhypoth`ese f(x) = f

(x)
et la propriete (f

(x

) = f

(x

), on obtient f(x) + f

(x

) = x

, x), cest-` a-dire


x

f(x). 2
Une fonction f Conv(E) nest pas necessairement sous-dierentiable en tout
point de son domaine. Comme nous allons le montrer, la diculte vient essentiellement
du fait que la fonction derivee directionnelle en x peut prendre la valeur . Le fait
que f
t
(x; d) = implique la vacuite du sous-dierentiel se voit clairement par
le point (i) de la proposition 3.37. La reciproque est le sujet de la proposition 3.43
ci-dessous. Une telle situation se presente pour la fonction convexe f denie par
f(x) =
_

x si x 0
+ sinon.
PSfrag replacements
0

x
(3.32)
Celle-ci nest pas sous-dierentiable en 0, parce que f
t
(0; 1) = .

Evidemment si
f
t
(x; d) = , alors f
t
(x; d) = + (proposition 3.18, point (iv)), mais ce nest pas
la valeur +de la derivee directionnelle qui empeche f detre sous-dierentiable en x.
Cest ce que montre lexemple suivant de fonction convexe f, dont le sous-dierentiel
en 0 vaut [1, +[ :
f(x) =
_
e
x
si x 0
+ sinon.
PSfrag replacements
0
e
x
Comme nous lavons mentionne au debut de cette section, la mise en evidence de
conditions susantes de sous-dierentiabilite est importante, car ces conditions de-
viennent alors un moyen de montrer que certains probl`emes doptimisation ont des
solutions. Cest le but de la proposition suivante.
3.5. Sous-dierentiabilite 83
Proposition 3.43 (sous-dierentiabilite) Si f Conv(E) et x domf, les
proprietes suivantes sont equivalentes :
(i) f(x) ,= ,
(ii) il existe y (domf)

tel que f
t
(x; y x) > ,
(iii) f
t
(x; ) est propre (ou ne prend pas la valeur ).
Ces proprietes sont veriees si x (domf)

.
Demonstration. [(i) (ii)] Soit y un point quelconque de (domf)

, qui est non


vide. Alors f
t
(x; y x) > sinon f(x) serait vide (par la proposition 3.37 (i)).
[(ii) (iii)] Comme f
t
(x; 0) = 0, il sut de montrer que f
t
(x; ) ne prend pas
la valeur . On raisonne par labsurde. Soit d
1
:= y x (qui peut etre nul, si
x (domf)

) et supposons quil existe d


0
E tel que f
t
(x; d
0
) = . On pose
d
t
:= (1t)d
0
+td
1
. Par convexite de f
t
(x; ) (point 1 de la proposition 3.19), f
t
(x; d
t
)
vaut pour t [0, 1[ et vaut + pour t > 1. Mais, pour ]0, 1] susamment
petit, x + d
0
domf (sinon la derivee directionnelle suivant d
0
ne vaudrait pas
). Alors, par convexite de domf,
x + d
t
= (1t)[x + d
0
] + t[x + d
1
] domf
pour t [0, 1] et meme pour t > 1 proche de 1 (car x + d
1
(domf)

par le
lemme 2.7). Mais alors, on ne peut avoir f
t
(x; d
t
) = + pour ces t > 1 (le qutient
dierentiel est monotone), comme arme precedemment.
[(iii) (i)] Si f
t
(x; ) est propre, cette fonction convexe a une minorante ane
(proposition 3.5) : x

E et R tels que pour tout d E on a


f
t
(x; d) x

, d) + .
En rempla cant d par td avec t , on voit que lon peut prendre = 0. Par la
proposition 3.37 (i), ce x

f(x) qui est donc non vide.


Finalement, si x (domf)

, la propriete (ii) est veriee en prenant y = x. 2


Proposition 3.44 (proprietes geometrique et topologique du sous-diffe-
rentiel) Soient f Conv(E), E
0
le sous-espace vectoriel parall`ele ` a a(domf),
P
E0
le projecteur orthogonal sur E
0
et x domf. Alors
1) P
E0
f(x) + E

0
= f(x),
2) f(x) est convexe et ferme (eventuellement vide),
3) x (domf)

P
E0
f(x) est non vide et borne,
4) x (domf)

f(x) est non vide et borne.


Demonstration. 1) Soient x

f(x) et h E

0
. Par la proposition 3.37 (i),
f
t
(x; d) x

, d) pour tout d E. Donc a f


t
(x; d) P
E0
x

+h, d), pour tout d E


0
.
Comme f
t
(x; d) = + si d / E
0
(car x+td / a(domf) pour tout t > 0), on a aussi
f
t
(x; d) P
E0
x

+ h, d), pour tout d E, ce qui montre que P


E0
x

+ h f(x).
84 3. Fonctions convexes
Reciproquement, si x

f(x), on peut ecrire x

= x

0
+ h, avec x

0
= P
E0
x


P
E0
f(x) et h = x

P
E0
x

0
.
2) Comme on a toujours f(x) +f

(x

) x

, x), le sous-dierentiel est donne par


f(x) = x

: f

(x

) x

, x) f(x).
Mais x

(x

) x

, x) est dans Conv(E) (proposition 3.27). Comme ensemble


de sous-niveau de cette fonction, f(x) est donc convexe et ferme.
3) Notons dabord que f(x) est non vide lorsque x (domf)

(proposition 3.43),
donc P
E0
f(x) ,= . Montrons ` a present que cet ensemble est borne. Pour un > 0
assez petit, on note L 0 une constante de Lipschitz de f sur B(x, 2) (domf)

(proposition 3.17). Soit x

un element non nul de f(x) (si le sous-dierentiel est


reduit ` a 0, il ny a plus rien ` a demontrer). En prenant y = x + x

/|x

| au
point (ii) de la proposition 3.37, on obtient |x

| f(x + x

/|x

|) f(x) L.
Donc |x

| L.
On demontre limplication inverse par labsurde. Supposons que x (domf)
(domf)

et que x

f(x) qui est suppose non vide (si le sous-dierentiel est vide,
il ny a plus rien ` a demontrer). Il faut montrer que P
E0
f(x) est non borne. Par
denition de x

, on a f(y) f(x) + x

, y x) pour tout y E. Soit E


0
une
normale non nulle ` a domf en x (elle existe par la proposition 2.28), qui verie donc
, y x) 0 pour tout y domf. Alors, on a f(y) f(x) + x

+ t, y x), pour
tout y E et pout tout t > 0. D`es lors x

+ t E
0
f(x) pour tout t > 0, ce qui
demontre que cet ensemble est non borne.
4) Si x (domf)

, E
0
= E et le point 3 montre que f(x) est non vide et borne.
Reciproquement, si f(x) est non vide et borne, E
0
= E par le point 1. Alors
(domf)

= (domf)

et on voit que x (domf)

par le point 3. 2
Nous avons deni le sous-dierentiel ` a partir de la derivee directionnelle. La propo-
sition suivante montre que lon peut retrouver les derivees directionnelles ` a partir du
sous-dierentiel : f
t
(x; ) est la fonction support de f(x).
Proposition 3.45 (formule du max) Si f Conv(E) et x (domf)

, alors,
pour tout d E, on a
f
t
(x; d) = sup
x

f(x)
x

, d). (3.33)
Le supremum est atteint si f
t
(x; d) < +.
Demonstration. En tant quelement de Conv(E) (proposition 3.19), f
t
(x; ) est
lenveloppe superieure de ses minorantes anes (proposition 3.28). Comme f
t
(x; )
est positivement homog`ene de degre 1 (proposition 3.19), toute minorante ane est
majoree par une minorante lineaire, si bien que f
t
(x; ) est aussi lenveloppe superieure
de ses minorantes lineaires : pour tout d E,
f
t
(x; d) = sup
x

E
x

,h)f

(x;h), hE
x

, d) = sup
x

f(x)
x

, d).
3.5. Sous-dierentiabilite 85
Montrons que lon peut remplacer le supremum par un maximum, lorsque d E
0
:=
domf
t
(x; ), qui est un sous-espace vectoriel (proposition 3.19). On a en eet
f
t
(x; d) = sup
x

f(x)
P
E0
x

, d) = sup
x

PE
0
f(x)
x

, d),
parce que P
E0
f(x) f(x) (point 1 de la proposition 3.44). On utilise alors le fait
que P
E0
f(x) est compact lorsque x (domf)

(points 2 et 3 de la proposition 3.44).


2
Le resultat precedent ne tient plus si x est sur la fronti`ere relative du domaine
de f. Voici un contre-exemple : f est lindicatrice de la boule-unite fermee de R
2
, pour
la norme euclidienne, et x = (1, 0). Alors f
t
(x; 0) = 0 et si d ,= 0 :
f
t
(x; d) =
_
0 si d
1
> 0
+ si d
1
0.
Comme la fonction
x
: d f
t
(x; d) nest pas fermee, elle ne peut etre la fonction sup-
port dun ensemble (proposition 3.14) et donc certainement pas du sous-dierentiel.
Dailleurs, ce dernier secrit f(x) = x

R
2
: x

1
0, x

2
= 0 et

f(x)
(d) =
_
0 si d
1
0
+ si d
1
< 0
est lenveloppe convexe fermee de
x
. Cette propriete est tout ` a fait generale pour les
fonctions de Conv(E) (voir lexercice 3.19).
On peut voir f comme une multifonction ou fonction/operateur multivoque, qui a
un element de E fait correspondre une partie de E. On note f : E E : x f(x)
cette correspondance.
Denitions 3.46 Soit : E F une multifonction. On denit le domaine de par
dom = x E : (x) ,=
et son graphe (attention, ce nest pas une partie de E T(F), mais de E F) par
gr = (x, u) E F : u (x).
Lorsque E est un espace euclidien (produit scalaire , )) et que F = E, on dit que
est monotone si
(x, u) gr , (y, v) gr : v u, y x) 0.
On dit que est monotone maximale si est monotone et si son graphe nest pas
strictement contenu dans le graphe dun autre operateur monotone. On verie facile-
ment que cette derni`ere propriete secrit aussi
v u, y x) 0, (x, u) gr = (y, v) gr .
86 3. Fonctions convexes
Proposition 3.47 (la multifonction f) Soit f Conv(E).
(i) Le graphe de f est ferme.
(ii) La multifonction f est monotone.
(iii) Si f Conv(E), la multifonction f est monotone maximale.
Demonstration. [(i)] Soit x
k
, x

k
gr f, avec x
k
x et x

k
x

. Il faut
montrer que (x, x

) gr f. Il sut en fait de passer ` a la limite dans


y E : f(y) f(x
k
) +x

k
, y x
k
).
[(ii)] Il sut dadditionner les deux inegalites f(x
2
) f(x
1
) + x

1
, x
2
x
1
) et
f(x
1
) f(x
2
) +x

2
, x
1
x
2
).
[(iii)] Soit (y, y

) E
2
tel que
y

, y x) 0, (x, x

) gr(f). (3.34)
Il sut de montrer que (y, y

) gr(f). Le probl`eme
min
xE
_
f(x) +
1
2
|x (y

+ y)|
2
_
a une unique solution x (en eet, le crit`ere tend vers linni ` a linni car f a une
minorante ane; il est aussi s.c.i. et strictement convexe). Celle-ci verie y

+y x
f( x). En prenant (x, x

) = ( x, y

+y x) dans (3.34), on trouve que y = x et donc


que y

f( x) = f(y). 2
Cest le caract`ere ferme de f qui rend f monotone maximale. La theorie des
inequations variationnelles etudie les operateurs (eventuellement multivoques) qui
ne derivent pas dun potentiel ( nest pas de la forme f, pour une fonction
f Conv(E)). Cette theorie englobe donc loptimisation. Lorsque les operateurs
consideres sont monotones, cest leur caract`ere maximal qui leur donne une chance
detre surjectif, comme le caract`ere ferme de f donne une chance au probl`eme
inf
x
(f(x) u, x)), equivalent ` a u f(x), davoir une solution. On voit que cela
ne sut pas et quune hypoth`ese de coercivite (equivalente ` a la croissance de f vers
linni ` a linni) peut etre bien utile.
La proposition suivante donne un lien entre la sous-dierentiabilite et la derivabi-
lite au sens de G ateaux.
Proposition 3.48 (lien avec la Gateaux-dierentiabilite) Soient f
Conv(E) et x (domf)

. Si f est G ateaux-differentiable en x, alors f est sous-


dierentiable en x et f(x) = f(x). Inversement, si f(x) est le singleton
x

, alors f est G ateaux-dierentiable en x et f(x) = x

.
Demonstration. Si f est G ateaux-dierentiable en x, la condition (ii) de la proposi-
tion 3.37 est veriee avec x

= f(x); donc f(x) f(x) et f est sous-dierentiable.


3.5. Sous-dierentiabilite 87
Dautre part, si x

0
f(x), la condition (i) de la proposition 3.37 montre que
f
t
(x) d x

0
, d), d E. La linearite de f
t
(x) implique que f
t
(x) d = x

0
, d),
d E et donc que x

0
= f(x). On en deduit que f(x) = f(x).
Si f(x) est le singleton x

, la formule du max (3.33) donne pour tout d E :


f
t
(x; d) = x

, d). Donc f est G ateaux-dierentiable en x et f(x) = x

. 2
Soit f une fonction convexe dierentiable. Alors f
t
est lipschitzienne si et seule-
ment si f

est fortement convexe. Cest ce que montre la proposition suivante [209],


qui nous sera utile dans lanalyse des algorithmes quasi-newtoniens (chapitre 10).
Proposition 3.49 (fonction convexe avec gradient lipschitzien) Soit f :
E R une fonction convexe et C
1,1
. On note f le gradient de f pour le produit
scalaire , ) et L > 0 la constante de Lipschitz de f pour la norme | | associee
` a ce produit scalaire. Alors, pour tout x, y E, on a
f(y) f(x), y x)
1
L
|f(y) f(x)|
2
.
Demonstration. Soient x, y E. On note x

= f(x) et y

= f(y). Alors
x f

(x

) et y f

(y

). Il sut de montrer la forte convexite de f

(voir
lexercice 3.8), cest-` a-dire
f

(y

) f

(x

) +y

, x) +
1
2L
|y

|
2
.
Par denition de f

, on a
f

(y

) = sup
yE
_
y

, y) f(y)
_
,
si bien que pour obtenir linegalite ci-dessus, il est utile de trouver une majoration
de f(y). En utilisant le developpement de Taylor avec reste integral, la constante de
Lipschitz de f et lidentite (iii) de la proposition 3.37, on obtient
f(y) = f(x) +f(x), y x) +
_
1
0
f(x + t(y x)) f(x), y x)dt
f(x) +x

, y x) +
L
2
|y x|
2
= f

(x

) +x

, y) +
L
2
|y x|
2
.
Alors
f

(y

) f

(x

) + sup
yE
_
y

, y)
L
2
|y x|
2
_
.
La borne superieure du membre de droite est atteinte pour y = x+
1
L
(y

). Apr`es
substitution, on obtient linegalite recherchee. 2
88 3. Fonctions convexes
3.5.2 Calcul sous-dierentiel
Quelques r`egles du calcul sous-dierentiel sont donnees dans les propositions suivantes
(on en trouvera dautres dans [209; 1993; section VI.4]). Les fonctions considerees sont
parfois supposees ne prendre que des valeurs nies, mais on trouvera au corollaire 13.16
une extension de certaines r`egles de calcul au cas de fonctions pouvant prendre la
valeur +.
Proposition 3.50 (multiplication par un scalaire positif ) Soit 0,
f Conv(E) et x E. Alors
(f)(x) = f(x). (3.35)
Demonstration. Cest une consequence immediate de la denition du sous-differen-
tiel. 2
Proposition 3.51 (sous-dierentiel dune somme) Soient f
1
, . . . , f
p

Conv(E) et x E. Alors
(f
1
+ + f
p
)(x) f
1
(x) + + f
p
(x). (3.36)
Legalite a lieu ci-dessus si

1ip
(domf
i
)

,= . (3.37)
Dans la condition (3.37), on peut remplacer (domf
i
)

par domf
i
si f
i
est
polyedrique.
Demonstration. On note f = f
1
+ + f
p
.
Linclusion (3.36) se deduit directement de la denition du sous-differentiel: si
x

i
f
i
(x) pour i = 1, . . . , p, alors x
i
(domf
i
) = domf et, pour tout h E,
f
t
(x; h) = f
t
1
(x; h)+ +f
t
p
(x; h) x

1
+ +x

p
, h), si bien que x

1
+ +x

p
f(x).
Supposons maintenant que (3.37) a lieu et que x

f(x); donc x domf. Il


sagit de decomposer x

en des sous-gradients des f


i
. On passe par la conjuguee de f
donnee par la proposition 3.36, point 2 : puisque f

(x

) est ni, on peut ecrire


f

(x

) = (f

1
f

p
)(x

) = f

1
(x

1
) + + f

p
(x

p
), avec x

= x

1
+ + x

p
.
Alors, dapr`es la denition du sous-dierentiel (proposition 3.37 (iii)):
x

1
+ + x

2
, x) = f
1
(x) + + f
p
(x) + f

1
(x

1
) + + f

p
(x

p
).
Mais on a toujours f
2
(x) + +f
p
(x) +f

2
(x

2
) + +f

p
(x

p
) x

2
+ +x

p
, x), si
bien que lidentite ci-dessus donne x

1
, x) f
1
(x)+f

1
(x

1
). Comme linegalite inverse
a toujours lieu, on obtient x

1
, x) = f
1
(x) +f

1
(x

1
), cest-` a-dire que x

1
f
1
(x
1
). De
3.5. Sous-dierentiabilite 89
meme pour les autres indices : x

i
f
i
(x
i
), pour tout i. Donc x

f
1
(x) + +
f
p
(x). 2
On ne peut pas se passer de la condition (3.37) pour avoir egalite en (3.36).
Par exemple, si f
1
est la fonction

x denie en (3.32) et f
2
= 1
],0]
, la somme
f = f
1
+f
2
a son domaine reduit ` a 0 et f(0) = R, alors que f
1
(0) +f
2
(0) = ,
parce que f
1
(0) = .
Proposition 3.52 (sous-dierentiel dune pre-composition par une fonc-
tion ane) Si A : E F est une fonction ane (Ax = A
0
x+b, avec A
0
lineaire
et b F) et g Conv(F), alors pour tout x E :
(g A)(x) A

0
_
g(Ax)
_
, (3.38)
o` u A

0
est lapplication lineaire adjointe de A
0
pour les produits scalaires utilises
dans le calcul de (g A)(x) E et g(Ax) F. On a egalite en (3.38), si
(A) (domg)

,= . On a aussi egalite en (3.38), si g est convexe polyedrique


et (A) domg ,= .
Demonstration. Demontrons (3.38). Soit y

g(Ax), suppose non vide. Alors,


pour tout x
t
E, on a (g A)(x
t
) = g(Ax
t
) g(Ax) +y

, A(x
t
x)) = (g A)(x) +
A

0
y

, x
t
x), ce qui montre que A

0
y

(g A)(x).
Demontrons legalite en (3.38) lorsque (A) (domg)

,= [resp. lorsque g
est convexe polyedrique et (A) (domg) ,= ]. Dans ce cas, g A Conv(E)
(proposition 3.6). Soit x

(g A)(x), ce qui secrit (proposition 3.37)


(g A)

(x

) + (g A)(x) = x

, x).
En introduisant g
0
Conv(F) par g
0
(y) = g(y + b), on peut ecrire g A = g
0
A
0
.
La relation ci-dessus implique que (g
0
A
0
)

(x

) est ni. Dautre part, (A


0
)
(domg
0
)

= ((A) b) (domg b)

= ((A) (domg)

) b, qui est donc non


vide [on trouve que (A
0
) domg
0
est non vide dans le cas polyedrique]. Dapr`es la
proposition 3.34, il existe alors un y

F tel que A

0
y

= x

et (g
0
A
0
)

(x

) = g

0
(y

).
On en deduit que (gA)

(x

) = g

0
(y

) = g

(y

)y

, b). La relation ci-dessus devient


g

(y

) + g(Ax) = A

0
y

, x) +y

, b) = y

, Ax).
Elle exprime que y

g(Ax) (proposition 3.37); donc x

0
(g(Ax)). 2
Proposition 3.53 (sous-dierentiel dune fonction marginale) Soient E
et F deux espaces euclidiens. On munit EF du produit scalaire (x, y), (x
t
, y
t
)) =
x, x
t
)+y, y
t
). On consid`ere une fonction : EF R et la fonction marginale
associee, denie par (3.6). Supposons que Conv(E F) et f Conv(E). Si
x E et f(x) = (x, y) (linmum est atteint en y F), alors
f(x) = s : (s, 0) (x, y).
90 3. Fonctions convexes
Demonstration. On a les equivalences suivantes :
s f(x)
f(x
t
) f(x) +s, x
t
x), x
t
E
(x
t
, y
t
) (x, y) +(s, 0), (x
t
, y
t
) (x, y)), x
t
E, y
t
F.
La derni`ere implication vient de ce que f(x
t
) (x
t
, y
t
) pour tout y
t
F.
Limplication vient de ce que le membre de droite est independant de y
t
et que
lon peut donc prendre la borne inferieure en y
t
dans le membre de gauche. On a donc
demontre que s f(x) ssi (s, 0) (x, y), qui est le resultat annonce. 2
Voici trois remarques sur ce resultat.
1. Il faut bien noter que, si la borne inferieure inf
y
(x, y) est atteinte en plusieurs y,
s : (s, 0) (x, y) ne depend pas du minimiseur y choisi. Cest une conse-
quence de la demonstration.
On a un autre eclairage sur cette independance par rapport ` a y en observant que
est constante sur lensemble M(x) := (x, y) : y minimise (x, ), si bien que
est aussi constant sur linterieur relatif de M(x) (exercice 3.26). Cependant
(x, y) peut varier lorsque (x, y) passe de linterieur relatif de M(x) ` a son bord.
Cest le cas de la fonction denie par (x, y) = max(0, [y[ 1), dont la fonction
marginale est nulle : M(x) = x [1, 1], (0, y) = (0, 0) si 1 < y < 1,
mais (0, 1) = 0 [0, 1].
2. Dautre part, si est dierentiable en (x, y), o` u y est un minimiseur quelconque
de (x, ), alors f est egalement dierentiable en x (car son sous-dierentiel est
un singleton) et on a
f(x) =
x
(x, y).
Cest comme si il y avait un minimiseur unique y(x), fonction dierentiable de x,
que lon ecrivait f(x) = (x, y(x)) et que lon calculait f(x) par une derivation
de fonctions composees :
f(x) =
x
(x, y) + y
t
(x)

y
(x, y).
On retrouverait le resultat ci-dessus en observant que
y
(x, y) = 0 car y mini-
mise (x, ).
3. Le fait que (x, ) ait un minimum unique nimplique nullement la dierentiabilite
de la fonction marginale en x. Par exemple, f est la fonction marginale de denie
par (x, y) = f(x) + y
2
. Cette derni`ere a un minimum y = 0 unique en y quel
que soit x, alors que f peut ne pas etre dierentiable.
3.6 Proximalite
3.6.1 Operateur proximal
Soient E un espace euclidien (produit scalaire , ) et norme associee | |) et f
Conv(E). Pour x donne dans E, on consid`ere le probl`eme
3.6. Proximalite 91
inf
yE
_
f(y) +
1
2
|y x|
2
_
. (3.39)
Il sagit donc de linf-convolution de f et
1
2
| |
2
, mais ca nest pas tr`es important de
le savoir. Il sera utile dintroduire une notation pour le crit`ere de ce probl`eme, qui
depend de x E :

x
(y) := f(y) +
1
2
|y x|
2
.
Dapr`es la proposition 3.5, f a une minorante ane, si bien que
x
(y) lorsque
|y| ; de plus
x
est s.c.i. et strictement convexe. D`es lors le probl`eme ci-dessus
a une solution unique. On la note
x
p
solution unique de (3.39)
et on lappelle le point proximal de x (celui-ci depend de f et du produit scalaire
utilise). Il est clair que le point proximal x
p
domf. On appelle operateur proximal,
lapplication
P
f
: E E : x x
p
.
Le point proximal est caracterise par la condition doptimalite de (3.39) : 0

x
(x
p
) = f(x
p
) + x
p
x. D`es lors
x = P
f
(x) g f( x) : x = x g. (3.40)
On note que lunicite de x
p
implique celle de
g
p
:= x x
p
.
On verra ` a la proposition 3.54 que ce sous-gradient nest autre que P
f
(x). Lalgo-
rithme qui, en x considere comme litere courant, choisit x
p
comme itere suivant est
appele lalgorithme proximal. Nous letudierons ` a la section 6.7.
On trouvera ` a la gure 3.8 une illustration du concept de point proximal dans le
PSfrag replacements
x
f f
xp xp x x
f(x) = [x[ f(x) = [x[
Fig. 3.8. Deux points de vue sur le point proximal associe ` a la fonction f = [ [
cas o` u E = R et f est la valeur absolue. Le graphique de gauche represente une
92 3. Fonctions convexes
premi`ere mani`ere de trouver le point proximal x
p
, vu comme solution de (3.39).
On y voit la fonction f et la fonction
x
(en tirets) obtenue en ajoutant ` a f une
fonction quadratique. Le point x
p
minimise
x
. La seconde mani`ere de trouver le
point proximal de x utilise lequation doptimalite (3.40) : la fonction quadratique
y f(x
p
) +
1
2
|x
p
x|
2

1
2
|y x|
2
, representee en tirets, a en y = x
p
la meme
valeur que f et un gradient valant x x
p
, qui est donc egal au sous-gradient g
p
de f
en x
p
. Les deux graphes sont donc osculateurs et x
p
est obtenu comme labscisse de
lunique point de contact entre ces deux graphes [40].
On verie facilement que si f est lindicatrice 1
X
dune partie convexe fermee non
vide X de E, P
f
est la projection sur X. On peut donc voir loperateur proximal
comme une generalisation de ce concept. Comme le montre la proposition suivante,
il a dailleurs des proprietes analogues ` a celle dune projection (comparez avec la
proposition 2.19) : P
f
est non-expansive et monotone.
Proposition 3.54 (operateur proximal) Soit f Conv(E). Loperateur
proximal P
f
a les proprietes suivantes :
(i) I P
f
= P
f
,
(ii) pour tout x et y E
P
f
(y)P
f
(x), yx) |P
f
(y)P
f
(x)|
2
,
(iii) pour tout x et y E
|P
f
(y) P
f
(x)|
2
+|P
f
(y) P
f
(x)|
2
|y x|
2
.
Demonstration. [(i)] On a (I P
f
)(x) = x x
p
= g
p
, avec g
p
f(x
p
). Dapr`es
le corollaire 3.41 et f Conv(E), on a x
p
f

(g
p
). Alors, legalite g
p
= x x
p
et
la caracterisation (3.40) montrent que g
p
= P
f
(x).
[(ii)] On a x
p
= x g
x
p
, avec g
x
p
f(x
p
), et y
p
= y g
y
p
, avec g
y
p
f(y
p
). En
retranchant
y x = y
p
x
p
+ (g
y
p
g
x
p
). (3.41)
En multipliant scalairement cette identite par (y
p
x
p
) et en utilisant la monotonie
du sous-dierentiel (proposition 3.47), on trouve
y
p
x
p
, y x) = |y
p
x
p
|
2
+g
y
p
g
x
p
, y
p
x
p
) |y
p
x
p
|
2
.
[(iii)] Linegalite sobtient en elevant (3.41) au carre et en tenant compte de la
monotonie du sous-dierentiel. 2
On peut appliquer le resultat precedent en prenant f

Conv(E) au lieu de f.
Le resultat (ii) secrit alors avec g
x
p
= P
f
(x) f(x
p
) et g
y
p
= P
f
(y) f(y
p
) :
g
y
p
g
x
p
, yx) |g
y
p
g
x
p
|
2
,
qui nest pas sans rappeler la proposition 3.49. Il y a deux dierences toutefois : il ny
a pas de facteur 1/L et g
x
p
nest pas un sous-gradient en x mais en x
p
.
3.6. Proximalite 93
3.6.2 Regularisee de Moreau-Yosida
Soient toujours E un espace euclidien (produit scalaire , ) et norme associee | |)
et f Conv(E). La regularisee de Moreau-Yosida de f est la fonction

f : E R
denie par

f(x) = inf
yE
_
f(y) +
1
2
|y x|
2
_
= f(x
p
) +
1
2
|x
p
x|
2
, (3.42)
o` u x
p
est le point proximal de x. On observe que

f est bien ` a valeurs reelles car
x
p
domf et f(x
p
) > (f ne prend pas la valeur ).
Cette notion est illustree en dimension 1 ` a la gure 3.9 lorsque f est la valeur
PSfrag replacements
x
f

f
1 xp x
f(x) = [x[

f(x)
Fig. 3.9. Regularisee de Moreau-Yosida

f de f : x [x[
absolue et | | = [ [. La ligne en tirets represente la fonction
x
dont on calcule le
minimum pour obtenir

f(x).
La proposition suivante donne quelques proprietes interessantes de la regularisee
de Moreau-Yosida. En particulier, elle montre que

f est toujours C
1,1
et regularise
donc f si celle-ci nest pas dierentiable. Cette regularisation se fait sans changer les
minima de f, ni sa valeur minimale.
Proposition 3.55 (regularisee de Moreau-Yosida) Soit f Conv(E).
Alors
(i) f P
f


f f.
(ii) inf

f = inf f.
(iii) arg min

f = arg min f = x E :

f(x) = f(x) = x E : x = x
p
.
(iv)

f Conv(E) et

f est C
1,1
avec

f(x) = x x
p
.
Demonstration. [(i)] La premi`ere inegalite se deduit du fait que

f(x) = f(x
p
) +
1
2
|x
p
x|
2
f(x
p
). Pour la seconde, on prend y = x comme argument de linmum
denissant

f.
94 3. Fonctions convexes
[(ii)] Du point (i), on a inf

f inf f. Par le meme point (i), on a

f(x) f(x
p
)
inf f; donc inf

f inf f.
[(iii)] Montrons dabord les equivalences :
f(x) =

f(x) x = x
p
x arg min f. (3.43)
Si f(x) =

f(x), linmum dans la denition de

f est atteint pour y = x, donc
x
p
= x; reciproquement, si x
p
= x, lexpression (3.42) de

f montre que f(x) =

f(x).
Considerons ` a present la seconde equivalence. Si x
p
= x, g
p
= x x
p
= 0 et donc 0
f(x) (equivalence (3.40)), ce signie que x arg min f; reciproquement, 0 f(x)
et x = x 0 impliquent que x
p
= x (par lequivalence (3.40)).
Il reste ` a montrer que
arg min f = arg min

f.
Si x arg min f, on a par (3.43) puis le point (ii) que

f(x) = f(x) = inf f = inf

f,
donc x arg min

f. Inversement, si x arg min

f, on a par les points (i) et (ii) :
f(x
p
)

f(x) = inf

f = inf f f(x
p
), si bien que lon a en fait egalite partout. Alors

f(x) = f(x
p
) implique que x
p
= x (voir la formule de

f) et donc x arg min f par
3.43.
[(iv)] La regularisee

f est la fonction marginale de (x, y) f(y) +
1
2
|xy|
2
, qui
est dans Conv(E E). Cette derni`ere est bornee inferieurement en y ` a x xe; donc
la regularisee est dans Conv(E) (proposition 3.8) et meme dans Conv(E) car elle est
partout nie (proposition 3.17). Dapr`es la proposition 3.53 :
s

f(x)
_
s
0
_
=
_
x x
p
g
p
+ x
p
x
_
,
pour un g
p
f(x
p
). D`es lors,

f(x) est le singleton x x
p
, ce qui implique la
dierentiabilite de

f, avec

f(x) = xx
p
(proposition 3.48). Comme xx
p
= P
f
(x),
la caract`ere lipschitzien de

f se deduit de celui de P
f
(proposition 3.54). 2
Notes
Bien que long, ces deux premiers chapitres ne donnent quun aper cu, utile ` a lopti-
misation, de limmense theorie quest lAnalyse Convexe. On en apprendra davantage
en travaillant les monographies de Rockafellar [320; 1970], dHiriart-Urruty et Lema-
rechal [209; 1993] et de Borwein et Lewis [58; 2000]. Elles traitent toutes les trois
de la theorie en dimension nie et sont orientees vers loptimisation. Elles ont ete
nos trois sources dinformation principales. Louvrage de Rockafellar est tr`es complet,
mais dicile. On trouve chez Hiriart-Urruty et Lemarechal ` a peu pr`es tout ce dont
on a besoin danalyse convexe en optimisation et on y apprend ` a manier chaque
notion avec de multiples points de vue. Le livre de Borwein et Lewis se concentre sur
lessentiel et laisse au lecteur la possibilite de mettre ` a lepreuve ses connaissances et
sa matrise du sujet sur de nombreux exercices instructifs et stimulants. Mentionnons
aussi la monographie dAuslender et Teboulle [22] consacree ` a lextension des notions
de c ones et fonctions asymptotiques ` a loptimisation non convexe et ` a letude des
inequations variationnelles.
3.6. Proximalite 95
Les livres dEkeland et Temam [129; 1974] et de Barbu et Precupanu [25; 1975]
sont des classiques de la dimension innie. Pour des traitements plus recents, on
pourra consulter Aubin et Ekeland [18; 1984] et Bonnans et Shapiro [54; 2000]. Le
syllabus de Cohen [90; 2000] est ` a signaler pour son c ote didactique et son haut niveau
dabstraction.
Le caract`ere monotone maximal du sous-dierentiel a ete mis en evidence par
Minty [266] et Moreau [278]. Le lecteur trouvera des complements sur la regularisee
de Moreau-Yosida dans larticle de Moreau [278], sur lequel nous nous sommes en
partie fondes. Cette notion setend aux operateurs monotones maximaux (voir par
exemple [64, 65]).
Exercices
3.1.

Epigraphe dune fonction convexe. Soit f : E R.
1) Montrez que f est convexe ssi son epigraphe stricte est convexe.
2) Montrez que, si f est convexe, (epi f)

= |(x, ) : x (domf)

, f(x) < .
3.2. Fonction convexe propre. Soit E un espace vectoriel et f : E R une fonction convexe.
Sil existe x (domf)

tel que f(x) > , alors f est propre.


3.3. Inegalites de convexite. Soit E un espace vectoriel et f : E R une fonction.
1) Inegalite de Jensen. Montrez que f est convexe si et seulement pour tout m-uple
(t1, . . . , tm) m et pour tout (x1, . . . , xm) (domf)
m
, on a
f
`P
m
i=1
tixi


P
m
i=1
tif(xi). (3.44)
2) On suppose que f est convexe et on se donne x0, x1 domf et t > 1 tel que
(1t)x0 +tx1 domf. Alors f((1t)x0 +tx1) (1t)f(x0) +tf(x1).
3) Inegalite des moyennes. La moyenne geometrique est inferieure ` a la moyenne
arithmetique : si |ai
n
i=1
sont n nombres positifs, on a (
Q
n
i=1
ai)
1/n

1
n
P
n
i=1
ai.
Remarque. Pour retenir le sens de cette inegalite, il sut de constater que
linegalite inverse na pas lieu si un des ai est nul et un autre ne lest pas.
3.4. Composition de fonctions convexes. Soient E un espace vectoriel, f : E R une
fonction convexe et : R R une fonction convexe croissante. Alors f est
convexe.
3.5. Exemples de fonctions convexes.
1) Forme quadratique. On consid`ere la fonction reelle denie sur R
n
par f(x) =
1
2
x

Ax +b

x, o` u A est une matrice dordre n symetrique et b R


n
. Alors f est
convexe si et seulement si A est semi-denie positive et f est strictement convexe
(et meme fortement convexe) si et seulement si A est denie positive.
2) Inf-convolution. Demontrez la proposition 3.9 sur linf-convolution, ainsi que les
proprietes suivantes :
(a) f g = f h g h,
(b) f 1
{0}
= f,
(c) 1A 1B = 1A+B.
3.6. Courbes de niveau dune fonction convexe. Chaque dessin A, B et C de la gure 3.10
represente 3 courbes de niveau (iso-valeurs) dune fonction f denie sur R
2
` a valeurs
dans R. De mani`ere plus precise, la courbe etiquetee i (i = 1, 2, 3) represente
lensemble |x R
2
: f(x) = i. Ces fonctions peuvent-elles etre convexes ?
96 3. Fonctions convexes
3
A B
2 3 1 1 2 3
C
1 2
Fig. 3.10. Courbes de niveau dune fonction convexe ?
3.7. Dierentiabilite directionnelle de la fonction max. Pour i |1, . . . , m, on sup-
pose donnees des fonctions fi : E R qui en x E sont continues et ont
des derivees directionnelles. On note fmax : R R la fonction max, denie par
fmax(x) = max
1im
fi(x), et I(x) := |i [[1, m]] : fi(x) = fmax(x). Alors
f

max
(x; d) = max
iI(x)
f

i
(x; d).
3.8. Caracterisation de la forte convexite dune fonction. Soit E un espace vectoriel eucli-
dien (produit scalaire , ) et norme associee | |). Soient > 0 et f : E R|+
une fonction non identiquement egale ` a +, ayant un domaine convexe et admettant
des derivees directionnelles en tout point de son domaine (celles-ci pouvant valoir
ou +). Les proprietes suivantes sont equivalentes :
(i) f est fortement convexe de module ;
(ii) pour tout x, y domf, x ,= y : f est continue sur ]x, y[ et
f(y) f(x) +f

(x; y x) +

2
|y x|
2
;
(iii) pour tout x, y domf, x ,= y : f est continue sur ]x, y[ et
f

(y; y x) f

(x; y x) +|y x|
2
.
3.9. Solution dun probl`eme doptimisation quadratique. Montrez que le probl`eme de min-
imiser sur R
n
la fonction f(x) =
1
2
x

Ax + b

x, o` u A est une matrice dordre n


symetrique denie positive a une solution unique. Montrez quil a encore une solu-
tion (mais plus necessairement unique) si A est seulement semi-denie positive et
b 1(A).
3.10. Probl`eme doptimisation sans solution. Soit F : R
n
R
m
, X R
n
et | | une norme
sur R
m
. On consid`ere le probl`eme min||F(x)| : x X. On suppose que 0 , F(X)
et que F(X) est un ouvert. Montrez que :
1) ce probl`eme na pas de solution,
2) si F est continue et |x
k
est une suite minimisante, ou bien |x
k
| , ou
bien liminf dX
c(x
k
) = 0 (dX
c(x
k
) est la distance de x
k
au complementaire de X,
supposee innie si X = R
n
).
Remarque. Ce resultat sapplique par exemple au probl`eme min|e
x
: x R.
3.11. Proprietes de la projection. Soit E un espace vectoriel euclidien (produit scalaire , )
et norme associee | |). Soient C une partie convexe fermee non vide de E et x un
point de E. On note x la projection de x sur C. Montrez que y C
y x, x x) 0 et |y x| |y x|.
Montrez par un exemple quaucune de ces proprietes ne caracterise la projection x.
3.12. Projection sur un c one convexe ferme. Soit E un espace vectoriel euclidien (produit
scalaire , )). Soient K un c one convexe ferme non vide de E et x E. Montrez que
x K est la projection de x sur K si et seulement si
3.6. Proximalite 97
x x, x) = 0 et y K : x x, y) 0.
3.13. Decomposition de Moreau [278]. Soient E un espace euclidien (produit scalaire , )),
K un c one convexe ferme de E et K

son c one dual negatif. On note PK et P


K
les
projecteurs orthogonaux sur K et K

respectivement. Montrez que, pour x, y et z


donnes dans E, les proprietes suivantes sont equivalentes :
(i) z = x +y, x K, y K

et x, y) = 0,
(ii) x = PK(z) et y = P
K
(z).
La decomposition de z en x +y comme en (i) sappelle la decomposition de Moreau.
3.14. Projection sur une somme de sous-espaces anes. Soient A1 et A2 deux sous-espaces
anes dun espace euclidien E. Si x est la projection dun point x E sur A1 + A2,
alors x x est orthogonal aux sous-espaces vectoriels associes aux sous-espaces anes.
3.15. Optimisation multicrit`ere, Pareto optimalite [217]. Soient X un ensemble et f : X
R
m
une fonction. On consid`ere les composantes de f comme m crit`eres ` a minimiser (on
parle doptimisation multicrit`ere). On dit que x X est Pareto optimal sil nexiste
pas de x X veriant fi(x) < fi(x) pour tout i, ce qui secrit aussi
x X, max
1im

fi(x) fi(x)

0.
On dit que x X est moyennement optimal sil existe un r R
m
+
, non nul, tel que
x minimise x r

f(x) sur X.
1) Montrez que x est Pareto optimal si et seulement si (f(x) R
m
++
) f(X) = .
2) On a represente ` a la gure 3.11, dans le cas o` u m = 2, un exemple densemble f(X).
f(X)
f
1
f
2
Fig. 3.11. Un ensemble f(X) dans R
2
Determinez dans celui-ci limage par f des points Pareto optimaux et limage par f
des points moyennement optimaux.
3) Montrez quun point moyennement optimal est Pareto optimal.
4) Montrez que, lorsque f(X)+R
m
+
est convexe (a fortiori lorsque f(X) est convexe),
un point Pareto optimal est moyennement optimal.
5) Montrez que f(X) + R
m
+
est convexe si X est convexe et si les fonctions fi sont
convexes; alors que f(X) ne lest pas necessairement.
3.16. Proprietes particuli`eres aux fonctions convexes polyedriques. Soient f, f1 et f2 des
fonctions convexes polyedriques. Alors
98 3. Fonctions convexes
1) f1 +f2 est polyedrique,
2) f1 f2 est polyedrique, epi f1 f2 = epi f1 +epi f2 et linmum dans la denition
de (f1 f2)(x) est atteint pour tout x dom(f1 f2) = domf1 + domf2,
3) f

est polyedrique.
3.17. Calcul de fonctions conjuguees. On note , ) le produit scalaire utilise pour denir la
conjuguee.
1) Fonction quadratique strictement convexe. Soient Q une matrice auto-adjointe de-
nie positive (pour le produit scalaire , )), q R
n
et f : R
n
R la fonction
quadratique denie par
f(x) =
1
2
Qx, x) +q, x).
Alors, pour tout x

R
n
,
f

(x

) =
1
2
Q
1
(x

q), (x

q)).
Si Q est seulement semi-denie positive, on a f

(Qx+q) =
1
2
Qx, x) pour tout
x R
n
et f

(x

) = + si x

, 1(Q) +q.
2) Si g(x) = f(x) +, alors g

(x

) = f

(x

) .
3) Monotonie. Si f, g : E R |+ verient (3.22) et f g, alors f

.
4) Enveloppe inferieure. Soient I un ensemble dindices quelconque et, pour i I,
des fonctions fi : E R |+ propres ayant une minorante ane commune,
i.e., x

0
E tel que sup
iI
f

i
(x

0
) < +. Alors leur enveloppe inferieure f
inf
:
E R |+ denie en x par f
inf
(x) = infiI fi(x) verie (3.22) et on a
f

inf
= sup
iI
f

i
.
5) Enveloppe superieure. Soient I un ensemble dindices quelconque et, pour i I,
des fonctions fi Conv(E) telles que leur enveloppe superieure fsup : E
R|+ denie en x par fsup(x) = sup
iI
fi(x) ait un domaine non vide. Alors
fsup Conv(E) et on a
f

sup
=

inf
iI
f

.
3.18. Enveloppe convexe fermee de fonctions convexes. Soient f, f1 et f2 Conv(E).
1) Si x0 (domf)

et x E, alors f

(x) = lim
t1
f((1t)x0 +tx).
2) a domf = a domf

, (domf)

= (domf

et adhdomf = adh domf

.
3) Si f1 et f2 Conv(E) et (domf1) (domf2) ,= , alors f1 +f2 Conv(E).
Si f1 et f2 Conv(E) et (domf1)

(domf2)

,= , alors (f1 +f2)

= f

1
+f

2
.
3.19. Fonction support du sous-dierentiel. Soient f Conv(E) et x E tel que f(x)
soit non vide. Alors la fonction support de f(x) est lenveloppe convexe fermee de
x() = f

(x; ) :
f(x)
=

x
x.
3.20. Allure du sous-dierentiel. Soit f Conv(E).
1) Soient x (domf)

et > 0. Montrez que



B(0, ) f( x) si et seulement si
f

( x; h) |h| pour tout h E.


2) Supposons que f soit sous-dierentiable en x E et que t R f(x + th) soit
dierentiable en 0. Alors f(x) f

(x; h)h/|h|
2
+h

.
3.6. Proximalite 99
3.21. Representation du sous-dierentiel. Soit f : R
2
R une fonction convexe, dont on
note f(x) le sous-dierentiel en x pour le produit scalaire euclidien. La gure 3.12
donne quatre dessins : A, B, C et D. Dans chacun deux, on a note x un point de R
2
,
( une partie dune courbe de niveau de f (i.e., f est constante sur une courbe con-
tenant () et S un ensemble. Pour chacun de ces dessins :
(a) dites si S peut etre lensemble x +f(x),
(b) dans larmative en (a) et si S = x +f(x), dites si x est un minimiseur de f,
(c) dans larmative en (a) et (b), et si S = x + f(x), dites si x est lunique
minimiseur de f.
(
x
x
(
x
(
S
S
S
(
S
A B C D
x
Fig. 3.12. Representation du sous-dierentiel dune fonction convexe ?
3.22. Fonction indicatrice. Soient P une partie non vide dun espace vectoriel E et 1P son
indicatrice.
1) 1P Conv(E) (resp. 1P Conv(E)) si et seulement si P est convexe (resp.
convexe ferme).
Supposons ` a present que E soit un espace euclidien.
2) Si K est un c one non vide de E, alors 1

K
= 1
K
.
3) Le sous-dierentiel de 1P en x E est le c one normal de P en x :
1P (x) = NP (x).
3.23. Norme. Soit E un espace norme dont on note f() := | | la norme.
1) Si un nombre reel 1, la fonction x E |x|

est convexe.
Supposons ` a present que E soit un espace euclidien (produit scalaire note , )).
2) Soient | |
D
la norme duale de | | par rapport ` a ce produit scalaire (voir (A.3))
et

BD la boule-unite fermee pour la norme duale. Alors
f

(x

) = 1
B
D
(x

) :=

0 si |x

|
D
1
+ sinon.
Soit | |
DD
la norme biduale de | |, cest-` a-dire la norme duale de | |
D
par
rapport au produit scalaire donne. Montrez que | |
DD
= | | et que
x E, x

E : |x

|
D
= 1 et x, x

) = |x|. (3.45)
Ce vecteur x

est parfois appele le vecteur dual de x.


3) Le sous-dierentiel de la norme secrit
f(x) = arg max
y
D
1
y, x) = |x

E : |x

|
D
1 et x

, x) = |x|.
En particulier, |x

|
D
= 1 si x

f(x) et x ,= 0.
100 3. Fonctions convexes
3.24. Valeur propre maximale. On note S
n
[resp. S
n
+
] lensemble des matrices dordre n
symetriques [resp. symetriques semi-denies positives], que lon munit du produit
scalaire A, B) = tr AB. On note max : S
n
R lapplication valeur propre maximale.
1) La fonction max est convexe.
2) La conjuguee de max est donnee par

max
(A

) =

0 si A

S
n
+
et tr A

= 1
+ sinon.
3) Le sous-dierentiel de max est donne par
max(A) = conv|vv

: |v|2 = 1, Av = max(A)v
(lenveloppe convexe ci-dessus est compacte). En deduire que max() est diffe-
rentiable en A si max(A) est simple, et que dans ce cas max(A) = vv

, o` u
v sont les uniques vecteurs propres unitaires correspondants ` a la valeur propre
maximale. Retrouvez ce dernier resultat en utilisant le theor`eme des fonctions
implicites.
3.25. Distance ` a un convexe. Soient E un espace vectoriel norme (norme notee | |) et C
un ensemble convexe ferme non vide de E. On consid`ere la fonction dC : E R, la
distance ` a C, denie par dC(x) = infyC |x y|.
1) dC est convexe.
On suppose dorenavant que E est un espace euclidien (produit scalaire note , ), mais
la norme | | nest pas necessairement celle associee ` a ce produit scalaire). On note

BD la boule-unite fermee pour la norme duale, NC(x) le c one normal ` a C en x et x


est la projection dun point x sur C.
2) d

C
= 1
B
D
+C.
3) dC(x) =



BD NC( x) : x

, x x) = |x x|

.
On suppose ` a present que la norme | | est celle associee au produit scalaire , ).
4) Si x / C, alors dC est dierentiable en x et dC(x) = (x x)/|x x|; si x C

(linterieur de C), alors dC est dierentiable en x et dC(x) = 0; enn si x


C = C \ C

(la fronti`ere de C), alors dC(x) =



B NC(x).
5) Montrez par un contre-exemple que si P E nest pas convexe, dP nest pas
necessairement dierentiable sur le complementaire de P.
3.26. Constance du sous-dierentiel. Soit f : E R une fonction convexe et supposons que
f soit constante sur un ensemble A. Alors f est constant sur A

et ce sous-dierentiel
commun est inclus dans celui de tout point de A.
3.27. Ensembles de sous-niveau bornes. Soient E un espace euclidien de dimension nie et
f : E R |+ une application dont on consid`ere les proprietes suivantes :
(i) f verie la condition de croissance positive ` a linni suivante
liminf
x
f(x)
|x|
:= lim
r
inf
xBr
f(x)
|x|
> 0,
(ii) les ensembles de sous-niveau de f sont bornes,
(iii) f

est continue en 0,
(iv) xEf(x) est un voisinage de 0.
Montrez que
1) (i) = (ii), mais que la reciproque nest pas necessairement vraie,
3.6. Proximalite 101
2) si f Conv(E), alors (i) (ii) (iii),
3) si f Conv(E), alors (i) (ii) (iii) (iv).
3.28. Proximite dune solution et petitesse dun sous-gradient. Soient E un espace euclidien
de dimension nie et f Conv(E). On suppose que lensemble S des minimiseurs de
f est non vide et borne. Montrez que, quel que soit r > 0, il existe un voisinage V de
0 E tel que dS(x) r lorsque x

f(x) V . Montrez par un contre-exemple que


ce resultat ne tient plus si S nest pas borne.
Remarque. Il ny a pas de reciproque : x peut etre proche de S sans quil y ait un
petit sous-gradient en x. La valeur absolue f = [ [ sur R en est un contre-exemple :
[f

(x)[ = 1 quel que soit x ,= 0.


3.29. Croissance quadratique locale (adapte de [326, 327]). Soient E et F deux espaces
normes. On dit quune multifonction T : E F est localement radialement lipschit-
zienne de module L 0 en un point x0 E sil existe un voisinage V de x0 tel que,
pour tout x V et pour tout y T(x), on a d
T(x
0
)
(y) L|x x0|. On consid`ere ` a
present, un espace euclidien E de dimension nie et une fonction f Conv(E) ayant
un ensemble de minimiseurs S non vide et borne. Montrez que les proprietes suivantes
sont equivalentes (L > 0).
(i) f
1
est localement radialement lipschitzienne de module L en 0,
(ii) il existe un voisinage V de 0 E tel que dS(x) L|x

| lorsque x

f(x)V ,
(iii) il existe une constante > 0 et un rayon r > 0 tels que pour tout x S +

Br,
on a f(x) inf f +d
2
S
(x).
Si (i) ou (ii) a lieu et sil y a un minimum unique, on peut prendre = 1/(2L) dans
(iii). Si (iii) a lieu, on peut prendre L = 1/ dans (i) ou (ii).
3.30. Point proximal limite. Soient E un espace euclidien de dimension nie, f Conv(E)
et r > 0. On note xp(r) le point proximal de x E, deni comme lunique solution de
inf
yE

f(y) +
1
2r
|y x|
2

.
Montrez que lorsque r :
(i) |xp(r) x| crot,
(ii) f(xp(r)) decrot,
(iii) si arg min f ,= , xp(r) converge vers la projection de x sur arg min f.
3.31. Proximalite ponderee. Cet exercice propose detendre la notion de point proximal au
cas dune penalisation quadratique generale. Soient E un espace euclidien (produit
scalaire , ) et norme associee | |) et f Conv(E). On se donne un operateur auto-
adjoint deni positif M auquel on associe un produit scalaire , )M = M, ) et une
norme | |M = , )
1/2
M
. Pour x donne dans E, le point proximal, toujours note xp,
est ici deni comme lunique solution de
inf
yE

f(y) +
1
2
|y x|
2
M

. (3.46)
On note P
f,M
: E E : x xp lapplication proximale ponderee par M. Le sous-
dierentiel f est calcule par rapport au produit scalaire non pondere , ). Montrez
que
(i) x = P
f,M
(x) g f( x) : x = x M
1
g,
(ii) I P
f,M
= M
1
P
f

,M
1 M,
(iii) pour tout x et y E, ypxp, yx)M |ypxp|
2
M
,
(iv) pour tout x et y E, |ypxp|
2
M
+ |g
y
p
g
x
p
|
2
M
1
|yx|
2
M
, o` u g
x
p
= M
1
(xxp) et g
y
p
= M
1
(yyp).
102 3. Fonctions convexes
3.32. Regularisee de Moreau-Yosida dune fonction quadratique. On suppose que f : x
E f(x) =
1
2
Ax, x) b, x) avec A symetrique denie positive et on consid`ere sa
regularisee de Moreau-Yosida
x E

f(x) = inf
yE

f(y) +
1
2
|y x|
2
M

,
o` u | |M = M, )
1/2
et M est une matrice symetrique denie positive. Montrez que

f est quadratique et que son hessien secrit


2

f = (A
1
+M
1
)
1
.
Extrait de

Elements dOptimisation Dierentiable : Theorie et Algorithmes, J.


Ch. Gilbert (Jean-Charles.Gilbert@inria.fr), ` a paratre. Version du 6 fevrier
2007.

Das könnte Ihnen auch gefallen