Sie sind auf Seite 1von 2

Auteur : Sylvain Hanneton (26/09/08)

Régression linéaire simple
Définition proposée
La régression linéaire est une procédure consistant à rechercher la droite qui passe 
       au plus  
 «
 près    »  d'un nuage de points
   .

Identification du modèle
Considérons un nuage de n points   M i   ( i ∈[ 1..n ] ) de coordonnées   x i   et   y i
correspondant  à deux  variables  aléatoires  X  et  Y.. On cherche  la  pente  a   et  l'ordonnée   à 
l'origine  b  de la droite tels que les valeurs prédites    y i = a⋅x i b , soient « les plus proches 
possibles » des valeurs observées  y i . En fait, a et b sont calculés de façon à minimiser le critère 
suivant :
n
C  a ,b =∑  y i − y i ²
i

La pente de la droite de régression est donnée par le rapport de la covariance entre X et Y sur la 
variance  s² X  de X.
cov  X ,Y 
a=
s² x

L'ordonnée à l'origine  b  est donnée par la formule suivante :
b=Y – a⋅X

où  Y
  et  X
  sont les moyennes de Y et X.

Qualité du modèle
La qualité de la régression linéaire, c'est à dire sa capacité à modéliser le nuage de points peut être 
quantifiée   en   utilisant   le   calcul   du   coefficient   de   détermination   obtenu   à   partir   du   calcul   du 
coefficient de corrélation   r   entre X et Y. Le coefficient de détermination donne une idée du 
pourcentage de variance expliquée (PVE) par le modèle.
Coefficient de détermination  cd = r²
Pourcentage de variance expliquée PVE =100⋅r²
Par exemple un PVE de 10% indique que le modèle linéaire n'explique que 10% de la variance du 
nuage de points.

Tests statistiques associés
La   régression   linéaire   permet   de   modéliser   la   relation   entre   deux   variables   aléatoires 
quantitatives. Elle permet notamment d'obtenir une prédiction concernant la valeur d'une variable 
en   fonction   de   l'autre.   Cependant,   cette   procédure   ne   dit   rien   quant   à   l'existence   d'une   liaison 
statistique entre ces deux variables. Pour quantifier la qualité de ce modèle ou déterminer si les 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  1
Auteur : Sylvain Hanneton (26/09/08)

variables X et Y sont liées, il est nécessaire d'effectuer un test de corrélation.

Statut de la fiche : 
fiche provisoire à revoir 

 Sauf mention contraire, le contenu du site est placé sous la protection de cette licence Creative Commons.  2

Das könnte Ihnen auch gefallen