Sie sind auf Seite 1von 20

© Gérard Lavau - http://perso.wanadoo.fr/lavau/homepage.

htm
Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitement. Toute diffusion à
titre onéreux ou utilisation commerciale est interdite sans accord de l'auteur.

GEOMETRIE AFFINE
PLAN
I : Espaces Affines
1) Définition
2) Repère
3) Barycentres
II : Sous–espaces affines
1) Droites et plans
2) Equations et paramétrages
a) Droites en dimension 2
b) Plans en dimension 3
c) Droites en dimension 3
III : Applications affines
1) Définition
2) Exemples
3) Propriété des applications affines
IV : Parties convexes
1) Définition
2) Convexes et applications affines

I : Espaces Affines

1– Définition
Considérons l'ensemble des complexes . Un complexe z = a + ib peut être considéré comme un
vecteur (on parle du vecteur d'affixe z) ou comme un point (on parle du point d'affixe z). Mais il
s'agit du même complexe z ! Celui-ci peut donc, au gré de l'utilisateur, être un point ou un vecteur. Il
x
en est de même de 
3
dont les éléments  y  peuvent être considérés comme les composantes d'un


z
vecteur ou les coordonnées d'un point. C'est seulement l'utilisateur qui va décider du regard qu'il
porte sur ce triplet. On peut évidemment généraliser ce point de vue à n, mais également à  

n'importe quel espace vectoriel. Les éléments d'un espace vectoriel peuvent être considérés
évidemment comme des vecteurs, mais dans ce chapitre, nous allons également les considérer comme
des points. Se pose alors la question suivante : si a et b, éléments de E sont des points, quel est le
x  x' 
vecteur qui les relie ? Si on regarde ce qui ce passe dans 3
, le vecteur reliant A  y  à B  y'  n'est
 
 
z  z' 
 x'–x 
autre que  y'–y , autrement dit, B – A. On procèdera de même dans le cas général. Dans E, le
 z'–z 
vecteur reliant a à b est le vecteur b – a. Pour conserver les notations usuelles en géométrie, nous
noterons les éléments de E avec une majuscule lorsqu'on les considère comme des points (A et B).
Le vecteur AB n'est autre que B – A.

-1-
On a alors les propriétés, bien connue en géométrie :
❑ Le relation de Chasles : AB + BC = AC puisque B – A + C – B = C – A.
❑ Pour tout point O de E, l'application M → OM est bijective. Sa réciproque est l'application qui, à
un vecteur v de E associe le point M tel que OM = v, autrement dit, M – O = v, ce que nous
noterons aussi M = O + v et qui est le translaté de O par la translation de vecteur v.

Voici un exemple moins habituel d'espace affine. Lorsque l'on résout une équation différentielle
linéaire à second membre nul, on trouve que l'ensemble Z des solutions est un espace vectoriel de
dimension égale à l'ordre de l'équation différentielle. C'est une droite vectorielle pour une équation
différentielle du premier ordre, un plan vectoriel pour une équation différentielle du second ordre.
Lorsque le second membre est non nul, la solution générale s'obtient en ajoutant à la solution
générale de l'équation homogène une solution particulière de l'équation avec second membre. Soit A
l'ensemble des solutions avec second membre, et y0 un élément particulier de A. A et Z sont tous
deux inclus dans l'espace E des fonctions. Z est considéré comme sous-espace vectoriel de E. En
effet, c'est le noyau d'une application linéaire. Ses éléments sont donc des vecteurs. Mais A est
considéré comme sous-espace affine. Il est en effet judicieux de considérer ses éléments comme des
points. Deux éléments y1 et y2 de A sont de la forme y0 + z1 et y0 + z2, avec z1 et z2 éléments de Z. La
différence y2 – y1 est alors un vecteur, élément de Z. De même que l'on obtient un point M d'une
droite affine à partir d'un point M0 de cette droite et d'un vecteur U colinéaire à un vecteur directeur,
de façon que U = M0M, de même on obtient une solution y de A à partir d'une solution particulière y0
et d'un vecteur de Z, z, de façon que z = y – y0.

Plus généralement, si Φ est un endomorphisme d'un espace vectoriel E, alors l'ensemble des solutions
de l'équation Φ(x) = 0 est un sous–espace vectoriel de E, le noyau de Φ. Mais l'ensemble des
solutions x de l'équation Φ(x) = b est un sous–espace affine de E. La différence de deux éléments
vérifiant cette équation est en effet un vecteur de Ker Φ.

2– Repère
Un repère de E est constitué d'un point arbitraire O de E et d'une base de E. Les composantes de M
dans ce repère, par exemple (0, i, j, k) pour la dimension 3, sont les uniques réels x, y et z tels que :
OM = x.i + y.j + z.k
M = O + x.i + y.j + z.k
On prendra en général O vecteur nul 0 de E, mais rien ne l'impose. n dispose d'un repère
 

canonique, à savoir l'origine 0 et la base canonique.

Un changement de repère consiste simultanément à changer d'origine et de vecteurs de base. Si ω est


la nouvelle origine, de coordonnées a, b, c dans l'ancien repère, et si P est la matrice de passage de
l'ancienne base (i, j, k) à la nouvelle base (I, J, K), alors les nouvelles coordonnées se trouvent en
écrivant :
ωM = OM – Oω ω
⇔ X.I + Y.J + Z.K = (x–a).i + (y–b).j + (z–c).k
 x–a  X

 y–b  Y
 =P 
 z–c  Z
ce qui amène à résoudre un système.

-2-
Exemple : la cycloïde. On considère un cercle tangent à l'axe des x, qui roule sans glisser sur cet axe.
On appelle θ l'angle dont la roue a tourné et on cherche les coordonnées de M qui était initialement
en O.
On dispose de deux repères : (O, i, j) considéré comme fixe, et (O', u, v) considéré comme mobile.
y

M
u
O'

O I x

Initialement, O'M = R.u = –R.j, puis u = –sinθi – cosθj, v = –cosθi + sinθj. En effet, θ est l'angle
entre u et –j. Par ailleurs, la condition de roulement sans glissement s'exprime par le fait que OO' est
égal à Rj + Rθi. En effet, le centre instantané de rotation du cercle est le point de contact I du cercle
. . .
avec l'axe des abscisses. La vitesse du point O' est donc égale à – θk ∧ IO' = Rθi où θ désigne la
dérivée de θ par rapport au temps, donc l'abscisse de O' est Rθ. Ainsi :
OM = OO' + O'M = Rj + Rθi + R(–sinθi – cosθj)
 x = Rθ – Rsinθ
⇒ 
î y = R – Rcosθ

3– Barycentres
PROPOSITION :
Soit (Ai) une famille de n points d'un espace affine et (λi) n réels. Alors :
n n
i) Si ∑ λi = 0, l'expression ∑ λi AiM ne dépend pas de M
i=1 i=1

n n
ii) Si ∑ λi ≠ 0, alors il existe un unique point G tel que∑ λi AiG = 0. G s'appelle
i=1 i=1

barycentre des points Ai affecté des coefficients λi.

Démonstration :

-3-
n n n
i) ∑ λi AiM = ∑ λi (M – Ai) = – ∑ λi Ai ne dépend pas de M
i=1 i=1 i=1

n
ii) On notera Λ = ∑ λi.
i=1

n n n
∑ λi Ai
i=1
∑ λi AiG = 0 ⇔ ∑ λi (G – Ai) ⇔ ΛG – ∑ λi Ai ⇔ G = Λ
i=1 i=1 i=1

Si le lecteur a un doute sur la validité de ce qui précède, il prendra une origine arbitraire O et écrira.
n n n n
∑ λi AiG = 0 ⇔ ∑ λi (OG – OAi) ⇔ ΛOG – ∑ λi OAi ⇔ OG = 1 Λ
∑ λi OAi
i=1 i=1 i=1 i=1

L'expression trouvée pour G entraîne également que le barycentre est inchangé lorsque l'on multiplie
tous les λi par une même constante non nulle. En particulier, on peut diviser tous les λi par leur
somme, et se ramener ainsi à des λi dont la somme vaut 1. G prend alors la forme simple :
n
G = ∑ λi Ai
i=1

Dans un repère, en dimension 3, si les coordonnées des Ai valent (xi, yi, zi), alors celles de G valent :
n n n
∑ λi xi ∑ λi yi ∑ λi zi
i=1 i=1 i=1
xG = , yG = et zG = xG =
Λ Λ Λ
Si tous les coefficients sont égaux, on parle d'isobarycentre.

Exemples :
– Le centre de gravité en physique.
– L'indice des prix (les informations ci-dessous datent de quelques années. Elles ont pu être mises à
jour depuis) : il s'agit d'un barycentre portant sur 295 articles. Ai est le prix de l'article n°i, et λi son
coefficient de pondération. On a par exemple :
Λ = 10000
λi = 106 pour le pain
= 12 pour le boeuf haché
= 5 pour les imperméables
= 59 pour les téléviseurs
= 299 pour l'automobiles
...

ASSOCIATIVITE DU BARYCENTRE :
Soit G barycentre des (Ai, λi)i∈I. On partitionne I en k parties disjointes Ii, ..., Ik, de façon que, pour
tout i, le barycentre Gi des (Aj, λj)j∈Ii soit défini (il suffit pour cela que la somme mi des λj pour j
élément de Ii soit non nulle). Alors G est le barycentre des (Gi,mi)i∈{1..k}

-4-
Démonstration :
On a en effet, en supposant que ∑ λj = ∑ mi = 1 :
 
∑ mi Gi = ∑ mi ∑ λj  k
k k
Aj = ∑ ∑ λj Aj = ∑ λj Aj = G
i=1 i=1
 mi
 i=1 j=Ii j=I

 j=Ii

Cette propriété facilite parfois le calcul du barycentre en fractionnant les difficultés.

BARYCENTRE EN PHYSIQUE
n
La propriété ∑ λi GAi = 0 joue un rôle fondamental en mécanique, lorsque les coefficients λi
i=1

représentent les masses mi des points Ai. En effet, dans bien des cas, un ensemble de points matériels
peuvent être remplacés par le barycentre. Cela apparaît dans les théorèmes de Koenig.

Théorème de Koenig pour le moment cinétique :


Le moment cinétique par rapport à un point O d'un système de n points matériels Ai de masse mi,
animés d'une vitesse Vi dans un repère donné vaut :
n
LO = ∑ OAi ∧ mi Vi
i=1

n
= ∑ (OG + GAi) ∧ mi Vi
i=1

n n
= ∑ OG ∧ mi Vi + ∑ GAi ∧ mi Vi
i=1 i=1

n n
= OG ∧ ∑ mi Vi + ∑ GAi ∧ mi Vi
i=1 i=1

n n
Or de l'égalité ∑ λi GAi = 0, on tire, en dérivant par rapport au temps : ∑ mi (Vi – VG) = 0
i=1 i=1

n n n
⇒ ∑ mi Vi = ∑ mi VG = M VG en notant M = ∑ mi
i=1 i=1 i=1

Ainsi :
n
LO = OG ∧ M VG + ∑ GAi ∧ mi Vi
i=1

= OG ∧ M VG + LG
Le moment cinétique du système par rapport à O est la somme du moment cinétique de G par
rapport à O et du moment cinétique du système par rapport à G. A noter que ce dernier peut être
calculé à l'aide des vitesses initiales Vi aussi bien qu'à l'aide des vitesses relatives au point G
vi = Vi – VG, puisque :

-5-
n n
∑ GAi ∧ mi vi = ∑ GAi ∧ mi (Vi – VG)
i=1 i=1

n n
= ∑ GAi ∧ mi Vi – ∑ mi GAi ∧ VG
i=1 i=1

= LG
n
puisque ∑ mi GAi = 0.
i=1

Théorème de Koenig pour l'énergie cinétique


Avec les notations précédentes, l'énergie du système dans le repère considéré vaut :
1 n 1 n

2 i=1
mi Vi2 = ∑ mi (vi +VG)2
2 i=1

1 n 1 n n
= ∑
2 i=1
mi vi2 + ∑ mi VG2 + ∑ mi <vi,VG> où < , > désigne le produit scalaire
2 i=1 i=1

1 n 1 n n
= ∑
2 i=1
mi vi2 + ∑ mi VG2 +< ∑ mi vi,VG> où < , > désigne le produit scalaire
2 i=1 i=1

n
d n
or ∑ mi vi = ∑ mi GAi = 0
i=1 dt i=1

1 n 1 n 1 n
⇒ ∑
2 i=1
mi Vi2 = ∑ mi vi2 + ∑ mi VG2
2 i=1 2 i=1
L'énergie cinétique du système est égal à la somme de l'énergie cinétique du barycentre et de l'énergie
cinétique du système dans le repère lié à G.

II : Sous–espaces affines

1– Droites et plans
DEFINITION :
Soit M0 un point de E et F un sous–espace vectoriel de E. On appelle sous–espace affine ou variété
linéaire affine passant par M0 de direction F l'ensemble des points M tels que M0M appartienne à
F. On le note M0 + F.

Si F est une droite vectorielle engendrée par V, M0 + F est appelée droite affine et est égal à
{M | M0M = αV} = {M = M0 + αV}.

Si F est un plan vectoriel engendré par (U, V), M0 + F est dit plan affine et est égal à
{M | M0M = αU + βV} = {M = M0 + αU + βV}.

Si F = {0}, alors M0 + F = {M0}.

Si F = E, alors M0 + F = E

-6-
Soit un autre sous–espace affine M1 + F de même direction. Alors, les éléments de M1 + F sont de la
forme M1 + u, u élément de F, qu'on peut également écrire M0 + M0M1 + u. On obtient un élément
de M0 + F si et seulement si M0M1 est élément de F. Les deux sous–espaces affines sont alors
confondus, sinon, ils sont disjoints.

PROPOSITION :
Soit B et C deux sous–espaces affines de direction respectives F et G. Alors, ou bien B ∩ C = ∅, ou
bien B ∩ C est un sous–espace affine de direction F ∩ G.

Démonstration :
En effet, si M0 est un point de B ∩ C, alors B ∩ C = {M | M0M ∈ F ∩ G}

PROPOSITION :
Soient (Ai)i∈I une famille de points d'un espace affine. L'ensemble des barycentre de ces points
affectés de coefficients quelconques forme un sous–espace affine appelé sous–espace affine
engendré par les (Ai). Ce sous–espace affine est le sous–espace affine passant par l'un de ces points
et de direction le sous–espace vectoriel engendré par les vecteurs (A1A2, ..., A1An). C'est le plus
petit sous–espace affine contenant la famille de points (Ai).

Démonstration :
Notons B le sous–espace affine passant par A1 et de direction F le sous–espace vectoriel engendré
par (A1A2, ..., A1An). Tous les Ai sont éléments de B.

Si G est barycentre des (Ai, λi), avec ∑ λi = 1, alors :


G = ∑ λiAi ⇒ A1G = ∑ λi A1Ai est élément de F
ce qui prouve que G est élément de B.

Inversement, si G est élément de B, alors il existe des λi, 2 ≤ i ≤ n, tels que :


n
A1G = ∑ λi A1Ai
i=2

Si l'on pose λ1 = 1 – λ2 – ... – λn, alors l'égalité précédente est équivalente à écrire que G est
barycentre des (Ai, λi), 1 ≤ i ≤ n.

Enfin, soit C un sous–espace affine contenant les Ai. Alors la direction de C contient F, et C contient
B, puisqu'il ne peut lui être strictement parallèle, puisqu'ils ont des points en commun.

EXEMPLE : Le théorème de Ménélaus (fin du Ier siècle)


Il s'énonce :

-7-
Soit un triangle ABC, et trois points distincts de A, B et C : P sur (AB), Q sur (BC) et R sur (AC).
P

B
Q

A R

Alors P, Q et R sont alignés si et seulement si :


  
PA QB RC
× × =1
  
PB QC RA

Dans la notation ci-dessus, PA désigne la mesure algébrique du couple (P,A). Il s'agit de la
composante du vecteur PA suivant un vecteur directeur de la droite (AB). Cette mesure dépend du

PA
vecteur directeur choisi, mais le quotient n'en dépend pas.

PB

Pour montrer que cette condition est nécessaire, on peut raisonner sur les coefficients de P, Q et R,
comme barycentres de A, B et C. Si A, B et C ne sont pas alignés et si on impose à la somme des
coefficients d'être égale à 1, il y a en effet unicité des coefficients. Cela est équivalent à faire un calcul
vectoriel, mais préserve la symétrie des rôles joués par A, B, C ou P, Q, R :

A B C
P p 1–p 0
Q 0 q 1–q
R = λP + (1–λ)Q 1–r = λp 0 = λ(1–p)+(1–λ)q r = (1–λ)(1–q)

q (1–p)(1–q) pq
On en déduit que λ = – , d'où r = et 1–r = –
1–p–q 1–p–q 1–p–q
  
PA 1–p QB 1–q RC 1–r
Par ailleurs : =– , =– et =–
 p  q  r
PB QC RA
D'où le résultat.

La réciproque se montre de la façon suivante :


Soient P, Q, R trois points vérifiant la relation, et soit R' l'intersection de (PQ) et (AC). Alors P, Q et
R' vérifient également la relation, ce qui prouve que R et R' sont les mêmes barycentres relativement
à A et C. Ils sont donc égaux.

2– Equations et paramétrages
Un repère est choisi. Il faut noter que les seules propriétés affines concernent le parallélisme, et ne
font aucunement intervenir la notion d'angles. Il est donc inutile de choisir systématiquement des
repères orthonormés.
-8-
a) Droites en dimension 2 :
Une droite (D) est donnée par deux points distincts A et B, ou par un point et un vecteur directeur V
(base de la droite vectorielle direction de (D)). Le premier cas se ramène au second en posant
AB = V. Si (a,b) sont les coordonnées de A, et (u,v) les composantes de V, alors :
M(x,y) ∈ (D) ⇔ ∃ λ, M = A + λV ⇔ ∃ λ, x = a + λu, y = b + λv.
Cela est une représentation paramétrique de (D). Inversement, étant donné une représentation
paramétrique d'une droite, on trouve un point quelconque de cette droite en prenant une valeur
arbitraire pour λ, et un vecteur directeur de cette droite en prenant les composantes u et v, en facteur
du paramètre. Si on élimine λ, alors on obtient une équation de (D) :
M(x,y) ∈ (D) ⇔ vx – uy = va – ub

Une méthode directe d'écriture de l'équation consiste à poser :


det(AM,V) = 0

Inversement, ax + by + c = 0 est l'équation d'une droite à condition que (a,b) ≠ (0,0). Un vecteur
directeur est alors donné par (–b,a).

b) Plans en dimension 3 :
On se donne maintenant trois points non alignés, ou de manière équivalente un point A et deux
vecteurs U et V non colinéaires. Alors :
M ∈ (P) ⇔ ∃ α, ∃ β, AM = αU + βV.
En utilisant des coordonnées, on obtient une représentation paramétrique du plan sous la forme d'un
système de trois équations aux deux inconnues α et β. Cette représentation est cependant peu
pratique, car pour savoir si un point appartient à (P), on est contraint de résoudre un système. On
peut donc résoudre le système une fois pour toute dans le cas général. En éliminant α et β, on
obtient une condition sur x, y et z, coordonnées de M pour qu'il y ait une solution. Cette condition
est une équation du plan.

Exemple : On se donne A(1,1,1), B(2,3,4) et C(2,0,1). Nous prendrons U = AB de composantes


(1,2,3) et V = AC = (1,–1,0). M(x,y,z) appartient au plan si et seulement si :
 x = 1 + α + β
∃ α, ∃ β  y = 1 + 2α – β
î z = 1 + 3α

 α = z–13
⇔ ∃ α, ∃ β  β = x – z – 2
î x + y – z3– 13= 0
⇔ x+y–z–1=0

Quant au plan vectoriel direction du plan affine, son équation est obtenue en supprimant les termes
constants : x + y – z = 0.

En effet, si ax + by + cz + d=0 est l'équation d'un plan affine (P), alors tout vecteur du plan vectoriel
direction peut s'écrire sous la forme MN avec M et N points de (P). Il suffit d'écrire l'équation de (P)
pour ces deux points, puis de retrancher membre à membre pour voir que MN vérifie la même
relation sans terme constant.

-9-
Si l'on pose Φ(x,y,z) = ax + by + cz, alors (P) est le plan d'équation Φ(x,y,z) + d = 0, de direction le
plan vectoriel Φ(x,y,z) = 0. Dans l'exemple donné plus haut, on peut donc d'abord chercher l'équation
du plan vectoriel engendré par U et V. Les coefficients de son équation sont les composantes du
produit vectoriel de (1,2,3) par (1,–1,0), soit (3,3,–3). On retrouve donc l'équation x + y – z = 0. En
effet, si on munit l'espace d'une structure euclidienne de façon que la base arbitraire choisie
initialement soit orthonormée, le produit scalaire est le produit scalaire canonique xx' + yy' + zz'. On
peut alors parler de produit vectoriel. U ∧ V est un vecteur orthogonal au plan. Un vecteur
appartient à ce plan si et seulement si le produit scalaire de ce vecteur et du vecteur orthogonal au
plan est nul. Pour avoir l'équation du plan affine, il suffit alors d'ajuster la constante pour que l'un des
points (et donc les trois) vérifie l'équation, soit x + y – z = 1.

Plus généralement, soit Φ : n → p une application linéaire et B un vecteur de ImΦ. Alors


   

l'ensemble des X tels que Φ(X) = B est un sous–espace affine A de direction le sous–espace vectoriel
E d'équation Φ(X) = 0. En effet, si X0 appartient à A, alors :
X ∈ A ⇔ X–X0 ∈ E ⇔ Φ(X–X0) = 0 ⇔ Φ(X) = Φ(X0) = B

Une des façons les plus rapides de trouver l'équation d'un plan consiste également à poser :
det(AM,U,V) = 0

 x–1 1 1 
Exemple :  y–1 2 –1  = 0 ⇔ 3(y–1) – 3(z–1) + 3(x–1) = 0 ⇔ x + y – z – 1 = 0
 z–1 3 0 

c) Droites en dimension 3 :
La situation décrite en a) se généralise à la dimension 3, (et même à n'importe quelle dimension). On
se donne A(a,b,c) et V(u,v,w). Alors :
M(x,y,z) ∈ (D) ⇔ ∃ λ, x = a + λu, y = b + λv, z = c + λw
Si l'on élimine λ, on obtient un système de deux équations indépendantes, chacune d'elles étant en
fait l'équation d'un plan. La droite est alors vue comme intersection de deux plans.

Inversement, si on se donne une droite par un système de deux équations, ces deux équations ne
doivent pas être celles de deux plans parallèles. Les équations homogènes ne doivent donc pas
représenter la même direction plane vectorielle. Pour cela, il faut et il suffit que ces deux équations
homogènes ne soient pas proportionnelles. Considérons le système :
 ax + by + cz = d

î a'x + b'y + c'z = d'
Il est extrêmement rapide de trouver un vecteur directeur de la droite. Il suffit de prendre :
 a   a' 
 b  ∧  b' 
   
 c   c' 
Il suffit pour voir cela de vérifier que le vecteur obtenu vérifie les équations homogènes. On peut
aussi considérer que l'espace est muni d'un produit scalaire pour lequel la base arbitraire choisie est
orthonormée. Dans ce cas, le vecteur (a,b,c) est orthogonal au premier plan, et le vecteur (a',b',c')
est orthogonal au deuxième. Un vecteur directeur doit être orthogonal à ces deux vecteurs. Il suffit
de prendre le produit vectoriel.

 ax + by + cz = 0
Enfin, la droite vectorielle a pour équation  a'x + b'y + c'z = 0
î

- 10 -
III : Applications affines

1– Définition
Une application affine f est une application d'un espace affine dans un autre et qui préserve la
structure de ces espaces. Cela signifie en particulier que le parallélisme, les propriétés barycentriques,
... devront être conservés.

Soit U un vecteur égal à AB et à CD. La condition sur le parallélisme se traduit par le fait que, (AB)
et (CD) étant parallèles (respectivement (AC) et (BD)), il doit en être de même de leurs images.
Ainsi le parallélogramme ABCD doit être transformé en un parallélogramme f(A)f(B)f(C)f(D). Cela
signifie entre autre que les vecteurs f(A)f(B) et f(C)f(D) sont égaux. Ces vecteurs ne dépendent donc
que de U et non d'un couple de points représentant ce vecteur. Nous les noterons donc Φ(U). Nous
avons donc :
f(A)f(B) = Φ(AB)

D f(A)
B
Φ(U) f(B)
U f(C)

C f(D)
A

Par ailleurs :
f(A)f(C) = Φ(AC)
= Φ(AB + BC) d'une part
= f(A)f(B) + f(B)f(C)
= Φ(AB) + Φ(BC) d'autre part
ce qui permet de conclure que :
Φ(U + V) = Φ(U) + Φ(V)

La condition de conservation du barycentre signifie que, si G est barycentre de (A,λ) et (B,1–λ),


alors f(G) est barycentre de (f(A),λ) et (f(B),1–λ). Nous avons donc :
GB = λAB ⇒ f(G)f(B) = λf(A)f(B) ⇒ Φ(GB) = λΦ(AB)
⇒ Φ(λAB) = λΦ(AB).

Il résulte des propriétés précédentes que Φ est linéaire. Nous posons donc :

DEFINITION :
f est une application affine de E dans F s'il existe une application linéaire de E dans F telle que :
∀ M ∈ A, ∀ n ∈ A, f(M)f(N) = Φ(MN).

Dans la plupart des cas, nous prendrons E = F.

- 11 -
Conséquences :
i) La connaissance de f ne nécessite que la connaissance de l'image d'un point donné par f et l'image
d'une base de E par Φ. La définition donnée est équivalente à :
f(N) = f(M) + Φ(MN)
ii) Si l'on se donne, par exemple en dimension 2, un repère (O, i, j), alors toute application affine est
de la forme analytique suivante :
 x' = ax + by + c

î y' = dx + ey + f

partie image
linéaire de O

PROPOSITION :
i) La composée f2 o f1 de deux applications affines f1 et f2, associées aux applications linéaires Φ1 et
Φ2 est une application affine associée à l'application linéaire Φ2 o Φ1.
ii) Une application affine f est bijective si et seulement si son application linéaire associée Φ est
bijective. Dans ce cas f–1 est affine et associée à l'application linéaire Φ–1.

Démonstration :
i) est évident : posons M' = f1(M), M" = f2(M'), et de même pour N. On a alors :
M"N" = f2(M')f2(N') = Φ2(M'N') = Φ2(f1(M)f1(N)) = Φ2[Φ1(MN)]
= Φ2 o Φ1(MN).

ii) On a plus précisément :


❑ f surjective ⇔ Φ surjective

Soit f surjective. Soit V = AB un vecteur de l'ensemble d'arrivée. Il existe M et N tels que f(M) = A
et f(N) = B. D'où Φ(MN) = f(M)f(N) = AB = V donc Φ est surjective.
Inversement, soit Φ surjective, et A un point de l'espace d'arrivée. Soit N un point quelconque tel
que f(N) = B. Φ étant surjective, il existe un vecteur U tel que Φ(U) = AB. Posons M tel que
MN = U. On a alors :
Φ(U) = AB ⇔ Φ(MN) = AB ⇔ f(M)f(N) = AB
or comme f(N) = B, on a donc f(M) = A, et f est surjective.

❑ f injective ⇔ Φ injective
Soit f injective et U est tel que Φ(U) = 0. Si U = AB, alors f(A)f(B) = 0, donc f(A) = f(B) et f étant
injective, on en déduit que A = B et que U = 0. Ainsi, Φ est injective.
Réciproquement, si f(M) = f(N), alors f(M)f(N) = 0 = Φ(MN) et Φ étant injective, on en déduit que
MN = 0, et donc que M = N.

Montrons maintenant que f–1 est affine.


f–1(M)f–1(N) = Φ–1 o Φ[f–1(M)f–1(N)] = Φ–1[f(f–1(M))f(f–1(N))]
= Φ–1(MN)

Il résulte de ce qui précède que l'ensemble des applications affines est stable par o, et que l'ensemble
des applications affines bijectives forme un groupe, appelé groupe affine. L'application identique en
est l'élément neutre, application affine dont l'application linéaire associée est également l'application

- 12 -
identique. On note GA(E) le groupe affine de E. L'application qui, à f élément de GA(E), associe Φ
élément de GL(E) est un morphisme de groupe.

2– Exemples
i) L'application identique f = Id est une application affine associée à l'application vectorielle Φ = Id.

ii) Inversement, si Φ = Id, quelles sont les applications affines f qui lui sont associées ? Si Φ = Id,
alors on a :
f(M)f(N) = MN
⇒ Mf(M) = Nf(N)
ou encore, avec d'autres notations :
f(N) – f(M) = n – M
⇒ f(N) – N = f(M) – M
Cela signifie qu'il existe un vecteur U tel que, pour tout M, Mf(M) = U ou encore f(M) = M + U.
Ainsi f est la translation de vecteur U.

Une application affine est associée à l'application linéaire Id si et seulement si c'est une translation

iii) Soit Φ = λId. Le cas λ = 1 est traité en ii). Si λ = 0, alors on a :


∀ M, ∀ N, f(M)f(N) = 0
⇒ ∀ M, ∀ N, f(M) = f(N) et f est constante. Nous supposerons désormais λ ≠ 0.

Supposons λ ≠ 1 et ≤ ≠ 0. Φ est une homothétie vectorielle de rapport λ. Alors, on a :


f(M)f(N) = λ.MN (*)
On se pose la question de savoir si f est une homothétie affine. Cherchons donc les points fixes N,
tels que N = f(N), s'il en existe. Prenons une origine arbitraire M = O et écrivons :
f(O)N = λ.ON
⇔ N – f(O) = λ(N – O)
f(O) – λ O
1
⇔ N=
1–λ 1–λ
Il existe donc un point fixe que nous noterons ω. Si nous remplaçons M par ω dans (*), nous
obtenons :
ωf(N) = λ.ω ωN
ou bien f(N) = ω + λ. ωN
f est une homothétie affine de centre ω et de rapport λ. ω est le seul point fixe. L'identité peut être
assimilée à une homothétie de centre quelconque de rapport 1. Tous les points sont invariants dans
ce cas.

L'ensemble des homothéties vectorielles de rapport non nul, muni de la composition des applications,
forme un groupe isomorphe à ( *,×). L'ensemble des applications affines qui leur sont associées,
 

muni de la composition des applications, forme donc aussi un groupe. Cet ensemble est constitué des
homothéties de centre quelconque, de rapport non nul (y compris l'identité), et des translations. Ce
groupe s'appelle groupe des homothéties–translations. La nature de la composée de deux de ces
applications se trouvent en regardant la composée des applications linéaires associées.
translation_de_U o translation_de_V = translation_de_U+V
translation o homothétie_de_rapport_λ = homothétie_de_rapport_λ

- 13 -
homothétie_de_rapport_α o homothétie_de_rapport_β = homothétie_de_rapport_αβ si
αβ ≠ 1
homothétie_de_rapport_α o homothétie_de_rapport_1/α = translation

On peut chercher des sous–groupes du groupe des homothéties–translations en cherchant des sous–
groupes du groupe des homothéties vectorielles, ou même de *, par isomorphisme :
 

* {homothéties {homothéties–translation}
vectorielles}

{1} {Id} {translation}

{±1} {±Id} {symétries centrales


translations}
etc...

Exemple : théorème de Ménélaus – deuxième méthode.


Rappelons–le :
Soit un triangle ABC, et trois points distincts de A, B et C : P sur (AB), Q sur (BC) et R sur (AC).
Alors P, Q et R sont alignés si et seulement si :
  
PA QB RC
× × =1
  
PB QC RA
On considère u homothétie de centre P : B → A
v ––– Q:C→B
w ––– R:A→C
h = u o v o w est donc une homothétie–translation. Comme A est invariant par h, il s'agit d'une
homothétie. Son rapport est le membre de gauche de la relation demandée. Si les points P, Q et R
sont alignés, la droite (PQR) est globalement invariante par h car elle l'est individuellement par u, v et
w, puisqu'elle contient le centre de chacune de ces homothéties. Or A, centre de h n'étant pas sur
cette droite, la seule possibilité pour qu'elle soit invariante est que h = Id. Son rapport est donc égal à
1.

iv) Supposons que E = F ⊕ G. Soit B de direction F et C de direction G. B ∩ C est réduit à un point


que nous noterons O. En effet, Soit M dans B et N dans C. Alors MN peut se décomposer en
MO + ON avec MO dans F et donc O dans B, et ON dans G et donc O dans C. O est unique, car s'il
y a un deuxième point O', OO' est à la fois élément de F et de G. Pour tout M de E, il existe P tel
que :
OM = OP + PM de façon que OP ∈ F et PM ∈ G.
P est donc élément de B. L'application f qui à M associe P s'appelle projection affine sur B
parallèlement à C (ou parallèlement à G puisque visiblement, seule la direction de C a une
importance). Il s'agit d'une application affine. En effet, si N se projette en Q, on a :
ON = OQ + QN
⇒ MN = PQ + QN – PM

∈F ∈G
ce qui signifie que f(M)f(N) = PQ est l'image de MN par la projection vectorielle Φ sur F
parallèlement à G.

- 14 -
Inversement, si Φ est la projection vectorielle sur F parallèlement à G, peut–on en déduire que toute
application affine f associée est une projection ? Pas nécessairement, comme le montre l'exemple
suivant :
E est le plan muni d'une base (i, j).
F est la droite engendrée par i
G est la droite engendrée par j
O est un point quelconque de E
 x' = x + 1
f est l'application définie analytiquement par  y' = 0
î
f est la composée d'une projection et d'une translation.

v) Supposons que E = F ⊕ G. Soit B de direction F et C de direction G. Nous avons déjà vu que


B ∩ C est réduit à un point que nous noterons O. Pour tout M de E, il existe P tel que :
OM = U + V de façon que U ∈ F et V ∈ G
OP = U – V
L'application f qui à M associe P s'appelle symétrie affine par rapport à B parallèlement à C (ou
parallèlement à G puisque visiblement, seule la direction de C a une importance). Il s'agit d'une
application affine. En effet, si n admet pour image Q, on a :
ON = W + Z avec W ∈ F et Z ∈ G
OQ = W – Z
⇒ MN = W – U + Z – V

∈F ∈G
et PQ = W – U – Z – V

∈F ∈G
ce qui signifie que f(M)f(N) = PQ est l'image de MN par la symétrie vectorielle Φ par rapport à F
parallèlement à G.

Inversement, si Φ est la symétrie vectorielle sur F parallèlement à G, comme pour la projection, on


ne peut en déduire que toute application affine f associée est une symétrie. On peut prendre un
exemple analogue à celui de la projection :
E est le plan muni d'une base (i, j).
F est la droite engendrée par i
G est la droite engendrée par j
O est un point quelconque de E
 x' = x + 1
f est l'application définie analytiquement par  y' = –y
î
f est la composée d'une symétrie et d'une translation.

vi) La symétrie et la projection entrent dans un cadre plus général.


Supposons toujours que E = F ⊕ G. Soit B de direction F et C de direction G. Nous avons déjà vu
que B ∩ C est réduit à un point que nous noterons O. Soit λ un réel. Pour tout M de E, il existe P tel
que :
OM = U + V de façon que U ∈ F et V ∈ G
OP = U + λ.V
Le cas λ = 0 correspond à la projection sur B parallèlement à C. Le cas λ = 1 correspond à
l'application identique. Le cas λ = –1 correspond à la symétrie par rapport à B parallèlement à C. Le
- 15 -
cas général s'appelle affinité de rapport λ relativement à B (ou de base B), parallèlement à C. Il s'agit
d'une application affine. En effet, si N admet pour symétrique Q, on a :
ON = W + Z avec W ∈ F et Z ∈ G
OQ = W + λ Z
⇒ MN = W – U + Z – V
⇒ MN = W – U + Z – V

∈F ∈G
et PQ = W – U + λ.(Z – V)

∈F ∈G
ce qui signifie que f(M)f(N) = PQ est l'image de MN par l'affinité vectorielle Φ de rapport λ
relativement à F parallèlement à G.

Exemple 1 : Dans l'espace de dimension 3 muni d'un repère (O, i, j, k), on demande l'expression
analytique de l'affinité de rapport –2 relativement au plan P d'équation 2x + y – z = 3 et parallèlement
à la droite de vecteur directeur V (1,0,1).
On peut déjà constater que la droite n'est pas contenue dans le plan, puisque x=1, y=0 et z=1
⇒ 2x + y – z ≠ 0. Soit M(x,y,z). On cherche une représentation paramétrique de la droite passant par
M et de vecteur directeur V. L'intersection de cette droite avec le plan P donne le point projeté de
M. Il est alors facile d'appliquer un rapport d'affinité. La représentation de la droite est :
 X = x + λ
Y=y
î Z = z + λ
Le projeté N de M sur P parallèlement à cette droite vérifie les équations ci–dessus ainsi que celle de
P, d'où –2x – y + z + 3 = λ. Les coordonnées de N sont donc :
 X = –x – y + z + 3
Y=y
î Z = –2x – y + 2z + 3
Le vecteur NM a donc pour composantes :
 2x + y – z – 3
0
î 2x + y – z – 3
L'image Q de M par l'affinité vérifie : NQ = –2NM. Le vecteur NQ a donc pour composantes :
 –4x – 2y + 2z + 6
0
î –4x – 2y + 2z + 6
Le point Q cherché a donc pour coordonnées :
 –5x – 3y + 3z + 9
y
î –6x – 3y + 4z + 9

Inversement, on peut trouver la nature d'une application affine en recherchant d'abord les points
invariants. Avec l'exemple précédent, on trouve le sous–espace P d'équation 2x + y – z – 3 = 0. On a
par ailleurs (QM) de vecteur directeur V (1,0,1), puisque QM = (6x + 3y – 3z – 3)V. L'intersection
de (QM) avec P conduit à trouver N et on vérifie enfin que QM = 3NM donc NQ = –2NM ce qui
permet de conclure à l'affinité de rapport –2.

- 16 -
Exemple 2 : Dans l'espace de dimension 3 muni d'un repère (O, i, j, k), on demande l'expression
analytique de l'affinité de rapport 3, de base la droite passant par le point de coordonnées (1,–1,2) et
de vecteur directeur V(1,1,–1), parallèlement au plan P d'équation x – y – z = 1.
Soit M(x,y,z). Le plan passant par M parallèlement à P a pour équation X–Y–Z = x–y–z. La
droite servant de base a pour représentation paramétrique :
 X = 1 + λ
 Y = –1 + λ
î Z = 2 – λ
Le projeté N de M sur cette droite parallèlement à P correspond à λ = x – y – z. Ce point a pour
coordonnées :
 X = 1 + x – y – z
 Y = –1 + x – y – z
î Z = 2 – x + y + z
Le vecteur NM a pour composantes :
 –1 + y + z
 1 – x + 2y + z
î –2 + x – y
L'image Q de M par l'affinité vérifie NQ = 3NM. Le vecteur NQ a donc pour composantes :
 –3 + 3y + 3z
 3 – 3x + 6y + 3z
î –6 + 3x – 3y
Le point Q a donc pour coordonnées :
 –2 + x + 2y + 2z
 2 – 2x + 5y + 2z
î –4 + 2x – 2y + z

Inversement, si l'on donne cette expression analytique et qu'on demande la nature de l'application
affine, on peut chercher l'ensemble des points invariants. Ils vérifient :
 Y + Z = 1 X=2+Y
 X – 2Y – Z = 1 ⇔  Z = 1 – Y
î X – Y = 2 î

Il s'agit de la droite de vecteur directeur (1,1,–1) et passant par le point (2,0,1). Il s'agit bien de la
droite initiale. Par ailleurs, pour M n'appartenant pas à l'ensemble des points invariants, le vecteur
QM a pour composantes :
 2 – 2y – 2z
 –2 + 2x – 4y – 2z
î 4 – 2x + 2y
La droite (QM) a pour représentation paramétrique :
 X = x + λ(2–2y–2z)
 Y = y + λ(–2+2x–4y–2z)
î Z = z + λ(4–2x+2y)
Cette droite coupe la base si λ vérifie λ(2y–2x+4) = 2–x+y et λ(2–2y–2z) = 1–y–z, ce qui est vérifié
1
pour λ = . (λ est indéfini si M appartient à la base, et donc si Q=M). Le point commun N a pour
2
coordonnées :
 X = 1 + x – y – z
 Y = –1 + x – y – z
î Z = 2 – x + y + z

- 17 -
Il est alors aisé de vérifier que NQ = 3NM. Pour conclure à l'affinité, il suffit de prouver que QM
appartient à un plan vectoriel indépendant de M. Les composantes de QM permettent de trouver
l'équation Y+Z=X

3– Propriétés des applications affines


PROPOSITION :
Soit f une application affine et Φ l'application linéaire associée à f. Alors :
i) Si B est un sous–espace affine de direction F, alors f(B) est un sous–espace affine de
direction Φ(F).
ii) Si B est parallèle à C alors f(B) est parallèle à f(C)
iii) Si G est le barycentre des (Ai,λi)i∈I, alors f(G) est le barycentre des (f(Ai),λi)i∈I.

Démonstration :
i) En effet, si M0 est un point donné de B, d'image f(M0) dans f(B), alors f(B) est le sous–espace
affine passant par f(M0) de direction Φ(F).
N ∈ f(B)
⇔ ∃ M ∈ B, N = f(M)
⇔ ∃ U ∈ F, N = f(M0 + U)
⇔ ∃ U ∈ F, N = f(M0) + Φ(U)
⇔ ∃ V ∈ Φ(F), N = f(M0) + V

ii) Supposons B de direction F et C de direction G.


B // C
⇔ F=G
⇒ Φ(F) = Φ(G)
⇔ f(B) // f(C)

iii) On peut supposer que ∑ λi = 1. On a :


∑ λi.GAi = 0
⇒ Φ(∑ λi.GAi) = Φ(0) = 0
⇒ ∑ λi f(G)f(Ai) = 0
⇒ f(G) est barycentre des (f(Ai),λi)

Cette propriété se traduit donc de la façon suivante :


G = ∑ λiAi ⇒ f(G) = ∑ λif(Ai)

Exemple : Théorème de Céva (1648 – 1834).


Il s'énonce :
Soit ABC un triangle, P élément de (AB), Q élément de (BC) et R élément de (AC).

- 18 -
B
Q
P
C

A R

Si les droites (CP), (AQ) et (BR) sont concourantes, alors, on a :


  
PA QB RC
× × = –1
  
PB QC RA

En effet, soit H intersection des trois droites. Il existe a, b et c tels que :


H = aA + bB + cC avec a + b + c = 1
Considérons la projection sur (AC) parallèlement à (BH). H se projette en R, d'où, en utilisant la
conservation du barycentre par une projection :
R = aA + bR + cC
a c
⇒ R= .A + .C
1–b 1–b
⇒ 0 = a.RA + c.RC

RC a
⇒ = – et de même pour les autres points
 c
RA

IV : Parties convexes

1– Définition
DEFINITION :
Une partie C d'un espace affine A est dite convexe si, pour tout point M et N de C, le segment
[M,N] est inclus dans C.

Le segment [M,N] est défini comme étant l'ensemble des barycentres de M et N à coefficients
positifs.

Exemples : Un disque, un sous–espace affine, un demi–plan

PROPOSITION :
Soit (Ci)i∈I une famille d'ensembles convexes. Alors ∩ Ci est un convexe.

La démonstration se déduit directement de la définition sans difficulté.

2– Convexes et applications affines


PROPOSITION :
Soit f une application affine
i) Soit C une partie convexe de l'ensemble de départ. Alors f(C) est convexe.
- 19 -
ii) Soit C une partie convexe de l'ensemble d'arrivée. Alors f–1(C), s'il est non vide, est
convexe.

Démonstration :
i) Soient M et N éléments de f(C). Il existe A et B éléments de C tels que M = f(A) et N = f(B). f
conservant les propriétés barycentriques, le barycentre G de (M,λ) et (N,1–λ) est l'image par f du
barycentre g de (A,λ) et (B,1–λ). g est élément de C, donc G est bien élément de f(C). Ce qu'on peut
noter :
G = λM + (1–λ)N
= λf(A) + (1–λ)f(B)
= f(λA + (1–λ)B)
= f(g)
avec g = λA + (1–λ)B

ii) Soient M et N éléments de f–1(C). Alors f(M) et f(N) sont élément de C. f conservant les
propriétés barycentriques, le barycentre G de (M,λ) et (N,1–λ) a pour image par f le barycentre g de
(f(M),λ) et (f(N),1–λ). g est élément de C, donc G est bien élément de f–1(C)

- 20 -

Das könnte Ihnen auch gefallen