Sie sind auf Seite 1von 11

Introduction

L’Analyse des données et la continuité de la Statistique descriptive

L’Analyse des données a pour objet l’analyse des grands tableaux

Tableau n lignes : individus


p colonnes : variables

quantitative : numérique (poids des étudiants)


Variable qualitative : modalités (couleur des cheveux)

Approche unidimensionnelle de l’analyse statistique : 1 variable

Variable quantitative : calcul des indicateurs de position et de dispersion

Indicateurs de position : moyenne, médiane et mode

Indicateurs de dispersion : variance et écart type


écart type
coefficient de variation =
moyenne

Variable qualitative : calcul de la proportion de chaque modalité

Variable quantitative ↔ Variable qualitative ordinale

Approche bidimensionnelle ou bi variée de l’analyse statistique : 2


variables

Y a-t-il un lien entre les deux variables ?

2 variables quantitatives X et Y : calcul du coefficient de corrélation linéaire R


 − 1,1
cov( X , Y )
R=
V ( X )V (Y )
R proche de 1 ou -1 → liaison linéaire entre X et Y

R proche de 0 → aucun lien entre X et Y

2 variables qualitatives : sont elles dépendantes ?

Y Y1 Y2 … Yp
X
X1 E11 E1.
X2
. Ei1 Eij Ei.

Xn En,p En.
E.1 E.j E.p

Eij est le nombre d’individus ayant la modalité i et la modalité j


X et Y sont indépendantes si pour tout i = 1,…n et j = 1,…p :

Ei .E. j
Eij = , n étant la taille commune de X et Y
n
Ei .E. j
Si Eij  , il y a une attraction entre les modalités xi et yj
n
Ei .E. j
Si Eij  , il y a une répulsion entre les modalités xi et yj
n

2
 Ei. E. j 
E −
p  ij

  → 2
n
n
D = 
2
( n −1)( p −1)
i =1 j =1
Ei. E. j
n

Le test de 𝜒 2 permet de tester l’hypothèse d’indépendance des 2


variables
Pour un niveau de signification donné : 𝛼

o L’hypothèse d’indépendance est rejetée si : 𝐷 2 > 𝜒 2𝑛−1 𝑝−1 ,1−𝛼


o Sinon les variables sont indépendantes

Condition d’utilisation du test de 𝜒 2 :

o 𝐸 ≥ 30
𝐸𝑖. 𝐸.𝑗
o ≥ 1 pour tout i = 1,…n et j = 1,..,p
𝑛
𝐸𝑖. 𝐸.𝑗
o Au moins 80% des effectifs ≥5
𝑛

𝑝 𝑝
E étant l’effectif total : 𝐸 = σ𝑛𝑖=1 σ𝑗=1 𝐸𝑖𝑗 = σ𝑛𝑖=1 𝐸𝑖. = σ𝑗=1 𝐸.𝑗
1 variable qualitative et 1 variable quantitative : Analyse de variance à 1
facteur

X est une variable quantitative qui peut être séparée en k groupes

Y est une variable qualitative à k modalités ni

x
j =1
ij

Chaque groupe est d’effectif ni et de moyenne xi =


ni

xij est la jème valeur de la variable X dans le groupe i


Facteurs A1 A2 … Ai … Ak
x11 x21 … xi1 … Xk1
x12 x22 xi2 xk2

x1n1 x2n2 xini xknk


Moyennes x1 x2 … xi … xk
k
n =  ni , l' effectif total de la variable X
i =1

Hypothèse : chaque échantillon caractérisé par le facteur A i i = 1,…,k, est


issu d’une variable normale N(mi, σ)

Somme quadratique totale SQT :  (x ij − x )


k ni
2

i =1 j=1

On peut démontrer que :

 (x ij − x ) =  (x ij − x i ) +  n i (x i − x )
k ni k ni k
2 2 2

i =1 j=1 i =1 j=1 i =1
 (x ij − x i ) : somme quadratique résiduelle (SQR )
k ni
2

i =1 j=1

 n (x − x ) : somme quadratique expliquée (SQE )


2
i i
i =1

On fait le test d’hypothèse suivant :


H0 : Y n’a pas d’effet sur X (égalité des moyennes)
H1 : Y a un effet sur X
SQE
On calcule la statistique F = k - 1 → F (k − 1, n − k )
SQR
n−k
H0 est rejetée si P(F(k-1,n-k)>F) < 0.05 ou 0.01
𝑆𝑄𝐸
Le coefficient de corrélation linéaire est définie par : 𝑒 2 =
𝑆𝑄𝑇
Approche multidimensionnelle

La régression linéaire multiple

Méthode factorielle → Analyse factorielle

Analyse en composantes principales ACP : tableau individus, variables


quantitatives

Analyse factorielle des correspondances AFC : croisement de 2 variables


qualitatives

Analyse des correspondances multiples ACM : tableau individus, variables


qualitatives

Méthode de classification : regroupements de lignes ou de colonnes

Méthode des centres mobiles ou k means

Classification ascendante hiérarchique


Méthodes de régression
• Régression simple
• Régression multiple

Méthodes factorielles : ACP, AFC, ACM

Méthodes de classification
• Méthode des centres mobiles
• Classification ascendante hiérarchique CAH

Das könnte Ihnen auch gefallen