Sie sind auf Seite 1von 8

Master 1 MIM : Universit de Nantes

Mai 2008

Examen d'Analyse des donnes


dure 3 heures documents interdits calculatrice autorise

Exercice I : DVS (4 points)


1. Rappeler le thorme sur la DVS 1 1 2. Effectuer la dcomposition en valeurs singulires de A= 1 1 . 0 2 3. En dduire la meilleure approximation de rang 1 de A.

Exercice II : Analyse factorielle discriminante dans le cas de deux classes (8 points)


On considre ici un tableau X dcrivant pour n individus p variables quantitatives centres. Les n individus sont rpartis dans deux classes d'effectifs respectifs n1 et n2 . L'objectif de cet exercice est de raliser l'analyse discriminante de ce tableau. Partie A : Etude thorique 1. Rappeler brivement l'objectif (et seulement l'objectif) de l'analyse discriminante (maximum 5 lignes) 2. Combien d'axes discriminants peut-on obtenir ici ? Justifier la rponse. 3. On note x kj la moyenne de la variable j pour la classe k. On note B = b jj la somme des carrs
'

inter-classes. a) Exprimer les centres de gravit g 1 et g 2 (vecteurs colonnes) en fonction des x kj . b) Exprimer B en fonction de n1 , n2 , g 1 , g 2 .. c) Justifiez que n1 g 1 n2 g 2 = 0 . En dduire g 2 en fonction de g 1 . d) Montrer que B = n 1 n2 ( g 1 g 2 ) ( g 1 g 2 ) '. n

e) On pose C = n 1 n 2 / n ( g 1 g 2 ) . Exprimer B en fonction de C.

4.

On note W la matrice des somme des carrs intra classes. On dfinit galement W =
W 1 dfinissant la mtrique de Mahalanobis (1893-1972).

1 W, n2

a) Soit u une fonction discriminante. Justifiez que u vrifie W 1 Bu = u , avec un rel strictement positif. b) Montrer que W 1 C est vecteur propre de W 1 B et en dduire que : = t C W 1 C= n1 n2 t ( g 1- g 2) W 1 ( g 1- g 2) n

c) Dterminer l'estimation de la distance au carr de Mahalanobis D p 2 entre g 1 et g 2 . En dduire que : Dp2 = n n 2 n1 n2

d) Montrer que u = W 1 ( g 1 - g 2 ). Cette fonction s'appelle la fonction discriminante de Fisher


(1890-1962). e) Comment s'interprte cette fonction en terme de projection orthogonale sur un axe et avec une mtrique prciser. f) La dmarche de Fisher a conduit chercher u tel que u rende maximal le rapport :
t

g1 u t g2 u u' W 1 u

Interprter ce rapport.

Partie B : Application
On considre deux groupes d'individus carctriss par deux variables quantitatives X et Y. Individu 1 2 3 4 5 6 X -6 -2 2 -2 2 6 1. Calculer g 1 , g 2 , B et W. 2. En dduire W 1 = 1 34 32 880 32 56 Y 4 1 -2 2 -4 -1 classe 1 1 1 2 2 2

3. En dduire directement l'estimation de la distance de Mahalanobis entre les deux centres de gravits. 4. En dduire la fonction discriminante de Fisher. 5. Calculer la variable discriminante et en dduire le taux d'erreur de classement.

Exercice III : Analyse de rsultats (8 points)


Les touristes trangers aiment bien venir en Aquitaine : ils ont pass 1,2 millions de nuits dhtel dans cette province en 2002. Vous me direz, ce nest pas beaucoup car pour la mme priode, on enregistre 3,8 millions de nuits dhtel pour les franais en Aquitaine. Le tableau suivant donne la rpartition de ces nuites selon un regroupement de pays ( en milliers de nuits dhtel ). Tableau I

Partie A : Analyse descriptive


1. Comment s'appelle ce tableau I? 2. Proposer deux questions auxquelles pourrait rpondre ce tableau. 3. Quel test statistiques peut-on proposer et pour quelle hypothse. 4. Deux nouveaux tableaux, II et III, se dduisent du prcdent (page suivante). a) Comment s'appellent ces tableaux et comment sont-ils construits ? b) Dterminer le profil ligne le plus proche du profil moyen.

Tableau II

Tableau III

Partie B : Analyse factorielle des correspondances


1. Les valeurs propres sont prsentes ci-dessous. (a) Justifier le nombre de valeurs propres obtenues. (b) Combien d'axes retiendriez-vous ? Justifier votre rponse. Tableau IV

2. Les rsultats sur les dpartements dans le tableau V. (a) Dfinir la qualit de reprsentation d'un dpartement. (b) Dcrire la qualit de reprsentation dans le plan F1-F2. (c) Les projections dans F1-F2 sont reprsentes dans les figures I, II et III. i. Dans la figure I, interprter la rpartition des profils ii. Dans la figure II, le symbole est proportionnel la qualit de reprsentation dans le plan. Quel est l'intrt de cette reprsentation ? iii. Dans la figure III, le symbole est proportionnel la contribution dans le plan. Quel est l'intrt et les limites de cette reprsentation ? Tableau V

Figure I

Figure II

Figure III

3. Les rsultats sur les pays sont prsents dans le tableau VI. (a) Dcrire la qualit de reprsentation dans le plan F1-F2. (b) Interprter chacun des axes F1 et F2. (c) Justifier la reprsentation simultane de la figure IV. (d) Rdiger une analyse synthtique des rsultats. Tableau VI

Figure IV 4. On utilise un profil supplmentaire, celui de la France (Tableau VII). (a) Dfinir la notion de profil supplmentaire. (b) Prciser son intrt. (c) Comment est obtenu le tableau VIII ? Le commenter. (d) Reprsenter la france dans la figure IV. Tableau VII

Tableau VIII

Das könnte Ihnen auch gefallen