You are on page 1of 24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

Bulletin de mthodologie sociologique


Bulletin of sociological methodology

95 | 2007 : July

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel


Modles de rgression mixtes paramtriques et non paramtriques*
VRONIQUE DUPR, ERIC LACOURSE, FRANK VITARO ET RICHARD E. TREMBLAY
p. 26-57

Rsum
Longitudinal Methods Based on Individual Development Trajectories Parametric and Non Parametric Mixed Models: Generalized linear mixed models encompass a variety of modern longitudinal analytic approaches based on individual developmental trajectories. These models overcome many important problems inherent to other traditional analysis of longitudinal data. They all rely on two basic levels: the lower one express, through a set of parameters, the individual pattern of change over time ( withinindividual change), whereas the upper level captures the variations between these parameters describing individual trajectories ( between-individual differences in change). However, other characteristics distinguish different sorts of mixed models, such as their assumptions concerning the distribution of the trajectories within the population. This introductory article presents the basic linear mixed model assuming a normal distribution of the unobserved heterogeneity, and the nonparametric mixture model that relies on a discrete approximation of the unobserved heterogeneity. Before comparing these two models, the first section of the article gives a general description of the notion of individual developmental trajectories. Les modles linaires mixtes gnraliss regroupent une varit de mthodes modernes
bms.revues.org/index408.html 1/24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

danalyse du changement fondes sur la trajectoire individuelle de dveloppement. Ces mthodes prsentent plusieurs avantages comparativement aux mthodes traditionnelles danalyse de donnes longitudinales. Elles permettent de dcrire, par le biais dun ensemble de paramtres, lvolution dattributs individuels au fil du temps (changement intraindividuel), ainsi que les variations au sein dune population quant ces patrons dvolution individuels (variations interindividuelles). Par ailleurs, plusieurs lments distinguent les diffrents modles mixtes, notamment quant aux postulats concernant la forme de la distribution de lhtrognit non-observ. Le prsent article introduit le modle linaire mixte gnralis postulant une distribution normale de lhtrognit et le modle mixte non paramtrique sappuyant sur une distribution discrte pour modliser les diffrences interindividuelles. Avant daborder les similitudes et les distinctions entre ces modles, une premire partie est consacre la description gnrale du concept de trajectoires individuelles de dveloppement.

Entres d'index
Mots cls : Modles mixtes, Trajectoires de dveloppement, Courbes de croissance, Postulats distributionnels, Variable latente continue, Variable latente catgorielle, Modles multiniveaux Keywords : Mixed Models, Multilevel Models, Developmental Trajectories, Distributional Assumptions, Continuous Latent Variable, Discrete Latent Variable Notes de l'auteur * Cette tude est supporte par des bourses dtude du Fonds de Recherche en Sant du Qubec (FRSQ) et du Conseil de recherche en sciences humaines du Canada (CRSH).

Texte intgral
1

Afin dapprhender le changement, les chercheurs ont couramment recours des plans de recherche longitudinaux dans lesquels des observations sur un ensemble dindividus sont rcoltes plusieurs reprises. Jusqu rcemment, les mthodes statistiques disponibles pour analyser ce type de donnes ne permettaient pas dextraire toute la richesse de linformation sur le changement contenue dans les tudes longitudinales (voir Rogosa, 1995). Dans les annes 1990, les modles mixtes fonds sur le concept mathmatique de trajectoire individuelle de dveloppement (aussi appels modles hirarchiques ou modles multiniveau) ont merg comme une alternative viable permettant de corriger plusieurs problmes des approches traditionnelles telles que lanalyse de variance mesures rptes (Menard, 2002; Metha & West, 2000). Depuis larrive de ces modles, plusieurs variations du modle mixte ont t dveloppes dont le modle mixte non paramtrique (Nagin, 1999; Nagin & Land, 1993). Malgr la supriorit mthodologique des nouveaux modles pour analyser le changement, les mthodes danalyse traditionnelles sont encore souvent utilises dans les tudes longitudinales (Willett & Singer, 2003; Willett, Singer, & Martin, 1998). La complexit de ces modles ainsi que la rapidit de leur volution ne sont certainement pas trangres cet tat de fait. Lobjectif du prsent article est de contribuer la diffusion des dveloppements rcents en analyse longitudinale, en offrant une description simple et gnrale de deux types de modles mixtes. Dabord, le modle mixte gnralis postulant une distribution normale de lhtrognit non-observe est prsent (Bryk & Raudenbush, 1992; Willett et al., 1998). Ensuite, le modle de mlange non paramtrique sappuyant sur une distribution discrte de lhtrognit est abord (Jones, Nagin, & Roeder, 2001; Land & Nagin, 1996; Nagin, 1999; Nagin & Land, 1993). Cette variation du modle mixte gnralis est retenue tant donn lintrt
2/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

grandissant suscit par cette approche pour rpondre des questions concernant des sous-populations atypiques (voir Eggleston, Laub, & Sampson, 2004). Avant daborder plus en profondeur les similitudes et les diffrences entre ces modles, une premire partie est consacre llaboration du concept de trajectoire individuelle de dveloppement.

Les trajectoires de dveloppement


Description gnrale
3

Selon Curran et Willoughby (2003), la trajectoire de dveloppement sert dcrire, pour un individu, un processus continu latent (c.--d. qui ne peut tre observ directement), mais dont une approximation peut tre obtenue en mesurant ses manifestations plusieurs reprises. Autrement dit, comme la trajectoire latente (ex., trajectoire de dlinquance) nest pas observable, elle est plutt infre partir dune suite de donnes recueillies au fil du temps (ex., une srie de mesure des comportements dlinquants). Elle peut tre reprsente graphiquement par une courbe illustrant le dveloppement en fonction du temps (voir figure 1). Cette courbe peut prendre plusieurs formes (linaires, quadratique, exponentielles, etc.). Dans le cas dune fonction linaire, la courbe sexprime, en termes mathmatiques, par une ordonne lorigine et une pente. Lordonne lorigine reprsente la valeur de la variable dpendante au temps zro (ex. : niveau de comportements dlinquants au dbut de ladolescence), alors que la pente reprsente le taux de changement par unit de temps (ex. : augmentation annuelle des comportements dlinquants au cours de ladolescence). Dautres paramtres peuvent tre ajouts pour dcrire des courbes plus complexes (ex., un terme dacclration pour dcrire une fonction quadratique). La nature des trajectoires de dveloppement leur confre plusieurs avantages pour ltude du changement.
Figure 1 : Exemples de trajectoires a) linaire et b) quadratique

Avantages
4

Lavantage premier des trajectoires de dveloppement est quelles reprsentent une modlisation explicite du changement individuel, ce qui nest pas le cas des mthodes traditionnelles danalyse du changement (ex., analyses de variance mesures rptes, Rogosa, 1995). Cette proprit deviendra vidente dans la section sur les quations dcrivant les trajectoires. Les mthodes fondes sur les trajectoires de dveloppement se
3/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

distinguent galement par leur flexibilit (Willett et al., 1998). Dabord, ce type danalyse ne requiert pas que les individus soient mesurs simultanment, la mme cadence, un rythme constant ou un nombre doccasions quivalent. En raison de cette grande flexibilit, lanalyse de trajectoires peut tre applique virtuellement tous les types de schmes longitudinaux. Plus spcifiquement, ceci signifie quil est possible dutiliser les trajectoires directement malgr la prsence de donnes manquantes (c.-.d. sans avoir recours un algorithme de remplacement). Il sagit l dune caractristique importante puisque les donnes manquantes sont trs frquentes dans les tudes longitudinales (Boyle & Willms, 2001; Raudenbush, 1993). Toutefois, mme si une trajectoire individuelle peut tre estime en prsence de donnes manquantes, la validit de la trajectoire ainsi obtenue est incertaine lorsque ces donnes manquantes napparaissent pas de faon alatoire (voir Allison, 2001 pour un texte introductif sur les mthodes de gestion des donnes manquantes). En dpit leur souplesse, lutilisation des trajectoires est soumise certaines conditions dutilisation.

Conditions dutilisation
Le nombre de temps de mesure
5

Un chercheur dsirant utiliser les trajectoires de dveloppement doit prvoir au moins trois points de cueillette de donnes chelonns dans le temps. En effet, ceci apparat comme un minimum ncessaire ltude du changement et, de manire plus spcifique, lutilisation des trajectoires de dveloppement. Rogosa et ses collaborateurs (1995; Rogosa, Brandt, & Zimowski, 1982) ont trs bien document la question, en montrant que lorsque seulement deux points sont connus, il est impossible de dterminer, parmi un ensemble de possibilits, la forme de la trajectoire sous-jacente. En effet, une multitude de courbes diffrentes (linaires, exponentielles, logistique, etc.) pourraient thoriquement traverser ces deux points. De plus, un design deux temps de mesure ne permet pas de distinguer le changement rel de lerreur de mesure. Par exemple, un chercheur pourrait observer une trajectoire ascendante pour un individu ayant en ralit une trajectoire horizontale, mais pour qui le premier score est sous le score rel et le deuxime au-dessus, en raison de lerreur de mesure. Lajout dun troisime temps de mesure est ncessaire afin de contourner ces obstacles. Toutefois, mme lorsque plusieurs temps de mesure sont disponibles, dautres problmes peuvent survenir si linstrument de mesure nest pas adquat.

La qualit de la mesure
6

La qualit de la mesure utilise pour quantifier le phnomne dintrt est primordiale. Deux lments principaux sont considrer dans le choix de la mesure. Premirement, il est essentiel que les donnes recueillies conservent la mme signification chaque point de mesure, sans quoi il est impossible de dterminer si le changement observ est attribuable aux variations de lchelle de mesure plutt qu une volution relle (Bryk & Raudenbush, 1987; Willett et al., 1998). Cette proprit, spcifiant que la variable dintrt doit tre mesure selon une mtrique uniforme, rfre au principe dinvariabilit (voir Curran & Willoughby, 2003). Une mesure est dite invariable lorsquun score de mme valeur reprsente toujours la mme quantit de la variable dintrt, peu importe le moment de la prise de mesure. Plusieurs tests standardiss nont pas t conus de
4/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

manire respecter ce principe (Bryk & Raudenbush, 1987; Raudenbush, 2001a). Au dpart, lobjectif de ces tests tait dattribuer des scores afin de distinguer les individus un seul moment dans le temps plutt que de dtecter le changement individuel dune prise de mesure lautre. Les stratgies de standardisation visant conserver constantes la moyenne et la variance pour tous les groupes dge ont un effet daplanissement qui diminue manifestement les possibilits dobserver le changement (Rogosa et al., 1982). De faon gnrale, la standardisation des scores est donc proscrire lorsque les trajectoires de dveloppement sont utilises pour modliser le changement (voir Willett et al., 1998). Deuximement, la validit de la mesure doit tre invariante pendant toute la dure de ltude (Singer & Willett, 2003; Willett et al., 1998). Le fait dutiliser le mme instrument de mesure pour chaque vague de collecte nassure pas la satisfaction de cette exigence. En effet, il apparat quune mesure valide lors dune collecte de donne ne lest pas ncessairement lors dune collecte subsquente, mme si celle-ci est effectue auprs des mmes individus. Par exemple, lobservation de la frquence de comportements tels que mordre ou donner des coups de pied peut savrer une mesure adquate du construit latent dagressivit chez les jeunes enfants, mais la validit de ces mmes items est douteuse pour valuer lagressivit des adolescents (Curran & Willoughby, 2003). Autrement dit, une diminution de la frquence de ces comportements nindique pas ncessairement une diminution de lagressivit, mais peut-tre simplement une complexification de ses manifestations au fil du temps. Lagressivit prsente donc une continuit htrotypique, puisque ses manifestations changent et quil nexiste pas de mesure valide pour tous les stades du dveloppement humain. Lorsque la validit dun linstrument est inconstante, linterprtation des courbes de croissances est impossible.

Modle mathmatique
quations
8

Les trajectoires de dveloppement ont t dveloppes afin de dcrire explicitement les changements systmatiques observs sur un attribut individuel en fonction du temps. En termes mathmatiques, les trajectoires sont quivalentes une quation de rgression o la variable indpendante temps (a, pour ge dans lexemple ci-dessous) sert prdire la variable dpendante (Y), cest--dire un score de dveloppement obtenu un temps donn. Par exemple, une trajectoire linaire peut tre exprime ainsi1 :
Equation 1 :

avec i = 1,, n individus, et o Yti reprsente le score obtenu par un individu i au temps t pour une mesure (ex., dlinquance); !0i reprsentelordonne lorigine et !1i la pente pour le mme individu i; et, finalement, ati reprsente le temps (ex. lge de lindividu i au temps t ). Le terme derreur eti reprsente lerreur alatoire associe au score de lindividu i au temps t , cest--dire lcart entre la trajectoire (valeur estime) et le score observ (mesure) au temps t pour cet individu i. Lquation linaire constitue le modle de changement le plus simple et le plus courant (Metha & West, 2000; Willett et al., 1998). Ce type de modle est adquat dans plusieurs situations et possde une valeur heuristique importante, ne serait-ce que pour
5/24

10

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

fournir un premier estim du processus de changement (Rogosa, 1995). Toutefois, lquation linaire ne dcrit pas toujours adquatement les donnes observes, et la spcification dquations non linaires peut savrer essentielle (Curran & Willoughby, 2003; Metha & West, 2000). Lorsque la prsence de relations non linaires est souponne, des termes supplmentaires peuvent tre ajouts lquation. Une quation polynomiale de puissance P constitue le modle gnral de la trajectoire de dveloppement individuel :
Equation 2 :

11

Dans cette quation, !2iajoute unecourbature (acclration ou dclration) la composante linaire !1i , et ainsi de suite. Les trajectoires ne sont pas limites aux fonctions polynomiales. Par exemple, elles peuvent tre reprsentes par une ligne brise (piecewise linear growth model, Bryk & Raudenbush, 1992) ou par une fonction exponentielle ou logarithmique (voir Curran & Willoughby, 2003; Singer & Willett, 2003). Ces trajectoires possdent des avantages spcifiques. Par exemple, elles permettent respectivement de modliser des points de transition ou des phnomnes asymptotiques o la trajectoire dveloppementale est borne par un minimum et un maximum. En effet, si la priode dobservation est suffisamment tendue, il est probable que le phnomne en dveloppement augmente ou diminue pendant une partie de ltude seulement et finisse par atteindre un niveau stable. Malgr lintrt de ces formes alternatives, une discussion dtaille de ces modles dpasse la vise du prsent article dintroduction, qui se concentre principalement sur les fonctions polynomiales plus couramment utilises et, plus spcifiquement, sur la fonction linaire.

12

Choix des paramtres


13

Le choix des paramtres estimer dans le modle estune tape cruciale. Il revt une importance particulire puisque dans le modle mixte paramtrique, les paramtres estims deviendront les variables dpendantes dcrivant les variations interindividuelles dans le changement (voir section 2). Ce choix dterminant peut tre guid par diffrentes considrations empiriques et thoriques (Willett et al., 1998).Le nombre de vagues de collectes effectues impose une premire contrainte. En effet, lajout de paramtres exige un nombre de points de mesure plus grand. De faon gnrale, le nombre maximal de paramtres pouvant tre inclus dans lquation quivaut au nombre de points de mesure moins un (Boyle & Willms, 2001; Willett et al., 1998). Par ailleurs, une augmentation du nombre de points permet non seulement des modlisations plus complexes, mais influence aussi positivement la puissance, la prcision et la validit (Raudenbush & Xiao-Feng, 2001; Willett et al., 1998). Ensuite, le choix doit tre guid par des considrations thoriques. En plus daider la spcification de la forme de la trajectoire, linterprtation des rsultats est grandement facilite lorsque le choix des paramtres sinscrit dans le cadre dune conceptualisation thorique. Les rsultats des recherches empiriques antrieures reprsentent aussi une source dinformations complmentaire. Finalement, lexamen des donnes individuelles est susceptible daider formuler des hypothses quant la forme du changement. Au-del de lexamen visuel, il existe des indices quantitatifs permettant de slectionner la forme qui prsente la meilleure correspondance avec les donnes (voir Curran & Willoughby, 2003; Singer & Willett, 2003). Certains de ces indices dajustement seront brivement prsents dans
6/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

les sections subsquentes sur les modles mixtes. Finalement, mentionnons que lajout de paramtres ne doit pas tre effectu aux dpens de la parcimonie. Laugmentation de la complexit doit tre contrebalance par un gain rel en prcision (Boyle & Willms, 2001).

Modles mixtes
14

Le modle mathmatique spcifi dans la section prcdente sert dfinir, par le biais de paramtres, une trajectoire reprsentant le dveloppement de chaque individu de lchantillon. Lorsquelles sont ainsi prises une une, les trajectoires renseignent sur lvolution intraindividuelle, cest--dire sur lvolution dun seul individu au fil du temps, par rapport lui-mme (Singer & Willett, 2003). Pour rpondre aux questions interindividuelles, concernant les diffrences relatives entre les trajectoires, lensemble des trajectoires reprsentant une population doivent tre considres simultanment (voir figure 2). La fonction des modles mixtes est prcisment de modliser les diffrences interindividuelles entre les trajectoires de dveloppement.
Figure 2 : Exemple dun ensemble de trajectoires de dveloppement linaires

Le modle mixte paramtrique


Description gnrale
15

Les modles mixtes, aussi appels modles multiniveaux (Goldstein, 1995), modles hirarchiques (Bryk & Raudenbush, 1992), modles coefficients alatoires (Longford, 1993) ou analyses de courbes latentes (Meredith & Tissak, 1990; voir Raudenbush, 2001a pour un rsum explicatif des diffrentes terminologies) ont t conus pour analyser des donnes organises en structure hirarchique. Lexemple typique dune structure hirarchique provient du domaine de lducation, dans lequel des lves sont nichs dans des classes, qui sont leur tour niches dans une cole, qui elle fait partie dune commission scolaire, etc. (Bryk & Raudenbush, 1992; Cheong & Raudenbush, 2000). Cette srie de regroupements reprsente autant de niveaux, du plus spcifique (llve, au niveau 1) au plus gnral (la commission scolaire, au niveau 4). Dans le cas des trajectoires de dveloppement, la structure hirarchique de base provient du fait que les diffrents temps de mesure (niveau 1) sont nichs dans un individu (niveau 2). Au niveau 1, les trajectoires de dveloppement permettent de rsumer en quelques paramtres toute linformation sur lvolution dun individu contenue dans une srie de
7/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

16

mesures. Lobjectif au niveau 2 est cette fois de reprsenter la distribution de ces paramtres individuels au sein de la population. Le niveau 2 permet de rpondre aux questions de recherches portant sur la position relative des individus: 1) est-ce quils partent tous au mme point? 2) est-ce quils voluent au mme rythme? 3) est-ce que ceux qui partent avec un score plus faible voluent plus rapidement? ou 4) est-ce que, au contraire, les carts sagrandissent, ceux ayant des scores levs au dpart voluant plus rapidement? Afin de rpondre ce type de questions, les paramtres prciss au niveau 1 deviennent, dans les modles mixtes, les variables dpendantes au niveau 2 (voir la section 2.1.4 sur les quations). Dans le modle mixte paramtrique, la moyenne et la variance dcrivant la distribution des paramtres de changement sont estimes au niveau 2, en supposant une distribution normale continue de ces paramtres . Autrement dit, il est attendu que les trajectoires individuelles se distribuent normalement autour dune trajectoire moyenne.

Avantages
17

18

19

Le premier avantage des modles mixtes est quils permettent dobtenir une estimation adquate ou honnte de lerreur, qui tient compte de la structure hirarchique des donnes (Boyle & Willms, 2001; Bryk & Raudenbush, 1992). Le postulat dindpendance des donnes inhrent aux mthodes traditionnelles ne peut tre soutenu lorsque les donnes sont organises en regroupements hirarchiques. En effet, il est attendu, dans les tudes longitudinales, que les mesures obtenues auprs dun mme individu au fil du temps soient corrles entre elles. Lorganisation des termes derreurs dans les modles mixtes permet de tenir compte de lautocorrlation des donnes. En plus de permettre lautocorrlation des observations, les modles mixtes accommodent galement lhtrognit de la variance de lerreur (htroscedasticit) souvent observe dans les tudes longitudinales (voir la section sur les quations pour plus de dtails sur lautocorrlation et lhtroscdasticit dans les modles mixtes). Lutilisation des modles mixtes sert galement partager la variance entre les diffrents niveaux hirarchiques, sans ncessiter lagrgation des donnes ou la sparation des analyses par niveau (Bryk & Raudenbush, 1992). Concrtement, ceci permet dvaluer linfluence relative des diffrents niveaux sur la variable dpendante en utilisant toute linformation disponible et en conservant une puissance statistique adquate (lagrgation des donnes diminue la puissance en diminuant le nombre de cas). Si lon se rfre lexemple classique de llve nich dans une classe qui est ellemme niche dans une cole, lanalyse multiniveau permet de dpartager quel point les diffrences au plan de la russite scolaire, par exemple, sont dues des diffrences individuelles (niveau 1), des diffrences associes au groupe-classe (niveau 2) ou lcole frquente (niveau 3). Cette caractristique ouvre la porte tout un pan dapplications intressantes concernant les influences contextuelles sur les trajectoires (Boyle & Willms, 2001). Dans le cadre longitudinal, leffet du contexte pourrait tre modlis par lajout dun troisime niveau au-del des points de mesure (niveau 1) nichs dans lindividu (niveau 2). Cette transformation peut se faire simplement, en suivant une logique hirarchique similaire celle prsente pour un modle deux niveaux (Raudenbush, 2001b, 2002). Finalement, afin dexpliquer les variations interindividuelles entre les trajectoires et intraindividuelles au sein des trajectoires, il est possible dincorporer des covariables fixes et des covariables qui varient dans le temps dans lquation. Les covariables fixes rfrent des caractristiques stables, comme le genre ou les antcdents familiaux.
8/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

20

21

22

Elles permettent destimer dans quelle mesure ces caractristiques arrivent expliquer les diffrences observes au niveau 2, entre les paramtres des trajectoires individuelles (Bryk & Raudenbush, 1992; Willett et al., 1998). Par exemple, le fait dtre de sexe masculin pourrait tre associ une augmentation plus marque de la dlinquance au cours de ladolescence. Par contre, les covariables qui varient dans le temps sont des caractristiques qui ont t mesures plusieurs reprises, et dont la valeur peut fluctuer chaque point de mesure. Elles permettent dexpliquer les variations intraindividuelles au niveau 1, pour un mme individu dun temps de mesure lautre. Par exemple, la trajectoire de dlinquance dun adolescent pourrait tre plus leve lorsquil est en contact avec des pairs dlinquants que lorsquil ne lest pas. La comparaison seffectue ici par rapport lindividu lui-mme plutt que par rapport autrui. La possibilit dinclure ces deux types de covariables constitue un avantage important, puisque quelle peut aider tester diffrentes thories du dveloppement (Curran & Willoughby, 2003; Nagin & Paternoster, 2000). En effet, linclusion de covariables fixes et variables permet de considrer simultanment limportance de traits stables ainsi que de circonstances de vie changeantes afin dexpliquer les diffrences entre les paramtres des trajectoires individuelles ainsi que les diffrences dun temps de mesure lautre pour un mme individu. Par exemple, si lon considre ltiologie des comportements dlinquants, la thorie de lhtrognit au sein de la population prdit que ce sont des caractristiques stables tablies tt au cours de la vie qui expliquent les diffrences individuelles : ceux qui possdent certains facteurs de risque, comme un temprament difficile, auront tendance manifester davantage de comportements dlinquants toutes les tapes du dveloppement. La stabilit relative de ces comportements au fil du temps serait donc explique par linfluence constante de ces facteurs de risque. Par contre, la thorie de la dpendance de ltat met laccent sur limportance des circonstances de vie pour comprendre lvolution des comportements dlinquants. Selon cette thorie, la stabilit de ces comportements existe parce que la manifestation de tels comportements change les circonstances de vie et augmente ainsi les probabilits den manifester dautres plus tard au cours du dveloppement. De plus, la considration des facteurs qui varient dans le temps permet dexpliquer non seulement la stabilit mais aussi dventuels changements. En effet, malgr leur stabilit relative, les comportements dlinquants fluctuent au fil du temps. Par exemple, certains peuvent prsenter ce type de comportement pendant ladolescence seulement (Moffit, 1993). Le recours des covariables qui varient dans le temps, comme la frquentation de pairs dlinquants, apparat comme une voie intressante afin dexpliquer ce type de phnomne. En ralit, ces deux thories ne sont pas mutuellement exclusives, et les recherches tendent montrer que les deux processus sont importants. Dans les modles mixtes, il est possible dvaluer limpact des vnements de vie changeants tout en contrlant pour les caractristiques stables. Toutefois, une partie de lhtrognit au sein de la population demeure non observe, puisquil est impossible de mesurer toutes les caractristiques stables pouvant potentiellement expliquer les diffrences individuelles. Les modles mixtes permettent de contrler non seulement pour les covariables fixes observes, mais aussi pour cette htrognit non observe. Cette caractristique provient du fait que les modles mixtes tiennent compte de lautocorrlation des donnes lors de lestimation des rsidus. En effet, cette autocorrlation serait due aux caractristiques stables de lindividu prsentes dun temps de mesure lautre, quelles soient observes ou non.

bms.revues.org/index408.html

9/24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

Postulats
23

Le modle mixte paramtrique prsume de la linarit et de la normalit distributionnelle des donnes et des effets alatoires, cest--dire des variations interindividuelles sur le plan des trajectoires. Mentionnons toutefois quil est maintenant possible de relcher le postulat de normalit en ce qui concerne la distribution des donnes (voir Raudenbush & Bryk, 2002). En effet, le modle mixte paramtrique peut sappuyer, pour les donnes, sur une distribution binaire (distribution de Bernouilli), sur une distribution doccurrence (distribution de Poisson) ou sur une distribution multinomiale. Mme si la distribution postule pour des donnes peut prendre diffrentes formes, le postulat de normalit de la distribution des effets alatoires demeure gnralement inchang dans les modles mixtes paramtriques. En rsum, il est donc attendu que les paramtres individuels se distribuent normalement autour des paramtres moyens, et ce peu importe la forme distributionnelle des donnes sous-jacentes. Le modle suppose donc que lensemble des trajectoires individuelles sont adquatement rsumes par un modle organis autour dune trajectoire moyenne unique. Autrement dit, le phnomne est conceptualis comme suivant une tendance gnrale commune (ex. : augmentation des comportements dlinquants pendant ladolescence), bien que lampleur de la tendance puisse varier dun individu lautre. Ces postulats sont particulirement importants afin de diffrencier le modle mixte paramtrique du modle de mlange non paramtrique.

quations
24

Dans le modle mixte paramtrique, les paramtres des trajectoires estims au premier niveau (intraindividuel) deviennent les variables dpendantes au deuxime niveau (interindividuel, Bryk & Raudenbush, 1992). En supposant une quation linaire au niveau 1 (voir quation 1), les quations dcrivant la variation au sein de la population de courbe (niveau 2) sont :
Equation 3 :

Equation 4 :

25

o !00 et !10 reprsentent respectivement lordonne lorigine moyenne et la pente moyenne de lensemble des trajectoires; r0i et r1i reprsentent leffet unique de lindividu i, c'est--dire la dviation des paramtres dcrivant sa trajectoire individuelle par rapport lorigine moyenne et la pente moyenne. Dans le vocabulaire associ au modles mixtes, !00 et !10 sont considrs comme des composantes fixes, puisquils ne prennent quune seule valeur pour lensemble de lchantillon, alors que r0i et r1i sont plutt identifis comme des composantes alatoires variant autour de lorigine moyenne et de la pente moyenne (Metha & West, 2000). Ce sont ces composantes alatoires qui reprsentent les variations interindividuelles autour des paramtres moyens. Dans le modle paramtrique, il est postul que ces composantes alatoires sont distribues selon une fonction continue spcifique, gnralement une normale. En substituant "0iet "0i dans lquation 1, on obtient le modle inconditionnel final
10/24

26

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

suivant (le terme inconditionnel signifie quaucune covariable na encore t insre):


Equation 5 :

27

o
Equation 6 :

28

Lestimation des rsidus nest pas la mme dans les modles mixtes que dans les modles de rgression ordinaire (Boyle & Willms, 2001). En rgression, il ny a quune seule estimation de lerreur, alors que dans les modles mixtes, lerreur est rpartie parmi les diffrents niveaux hirarchiques (voir lquation 6). Dans lquation (3) de niveau 2, le terme derreur (r0i) est constant pour lindividu i, peu importe le temps de mesure considr. Autrement dit, une partie de lerreur associe lindividu i au niveau 2 est invariante au fil du temps. Ceci reflte le fait que les donnes, rcoltes auprs dun mme individu au fil du temps, sont autocorrles. Cest ce terme derreur individuel constant qui permet de contrler pour lhtrognit non observe. Le modle accommode galement lhtrognit de la variance de lerreur (htroscedasticit). En effet, dans lquation (5) intgrant les quations de niveau 1 et de niveau 2, le terme derreur associ la pente, r0i, est multipli par le temps (ici le terme a, qui reprsente

29

lge). Ainsi, la magnitude de lerreur, et donc sa variance, peut varier avec le temps. Linclusion de covariables au niveau 2 sert prdire les variations individuelles sur !0iet !1i partir de caractristiques individuelles fixes, comme le sexe. Si lobjectif est dexaminer les diffrences entre les garons et les filles aux plans de lordonne lorigine et de la pente, une variable binaire GAR (0 pour les filles, 1 pour les garons) peut tre insre dans les quations (3) et (4), qui deviennent respectivement :
Equation 7 :

Equation 8 :

30

o "01 reprsentela diffrence entre les origines moyennes des garons et les filles, et "11 reprsente la diffrence entre les pentes moyennes des garons et des filles. Au niveau 1, il est possible dinclure des covariables qui varient dans le temps. Par exemple, la composition du groupe damis principal nest pas fixe dans le temps. Si lon reprend lexemple dune trajectoire de dlinquance au fil du temps, on pourrait se demander si le fait de frquenter des pairs dlinquants (AMI) influence cette trajectoire. Lquation suivante sert modliser ce type deffet en ajoutant un terme lquation 1:
Equation 9 :

31

32

o AMIti reprsente le nombre damisdlinquants pour lindividu i au temps t et o !2i reprsente leffet du nombre damis dlinquants pour lindividu i. En remplaant !0i et
11/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

!1i dans lquation (9) par les formules (7) et (8), on obtiendrait un modle conditionnel final incluant des covariables fixes et des covariables qui varient dans le temps.

Estimation des paramtres et ajustement du modle


33

34

Les procdures destimation reposant sur la mthode des moindres carrsne sont pasadquates lorsque le postulat dindpendance des donnes ne peut tre rencontr, comme dans le cas des donnes longitudinales recueillies auprs dun mme individu. Dautres problmes avec cette procdure proviennent du fait que la variabilit de la prcision des paramtres estims au niveau 1 nest pas prise en compte (Singer & Willett, 2003). En effet, les estims tirs de cette mthode sont imprcis lorsque le nombre de points de mesure est petit (Bryk & Raudenbush, 1992). En raison de ces faiblesses, des mthodes destimation fondes sur le principe de maximum de vraisemblance (maximum likelihood) sont le plus souvent utilises pour les modles mixtes. Ces mthodes, en plus de possder des proprits mathmatiques dsirables, ont lavantage de tirer profit des forces de lchantillon, en donnant plus dimportance aux donnes les plus prcises (Bryk & Raudenbush, 1987; Kenny, Bolger, & Kashy, 2002). Une description dtaille du principe de maximum de vraisemblance dpasse le cadre du prsent article (voir Bryk & Raudenbush, 1992), mais titre indicatif, mentionnons que le but de cette mthode est destimer les paramtres pour lesquels il est le plus probable dobserver les donnes rellement obtenues. De plus, afin de comparer ladquation de modles diffrents, des indices dajustements peuvent tre utiliss (voir Singer & Willett, 2003). Pour les modles nichs, o lun des modles reprsente une simplification de lautre2, la statistique de dviance peut tre utilise afin de dterminer celui des deux modles qui sajuste le mieux aux donnes (Singer & Willett, 2003). Si, en se basant sur la table du chi-carr, la valeur de la statistique est significative, il est possible daffirmer que le modle avec la plus petite valeur de la fonction du logarithme de vraisemblance (log-likelihood, LL) est celui qui sajuste le mieux aux donnes. Lorsque les modles ne sont pas nichs, dautres statistiques sont utilises. Ces statistiques sont prsentes plus en dtail dans la section sur lajustement des modles mixtes non paramtriques.

Le modle mixte non paramtrique


35

Larrive des modles mixtes a rvolutionn lanalyse des donnes longitudinales (Menard, 2002). Ces modles ont eu, et ont encore, une grande valeur heuristique. Malgr leur utilit, ils ne sont toutefois pas sans limites. Notamment, tant donn quils prsument dune distribution normale des paramtres dcrivant les trajectoires, ces modles peuvent tre biaiss lorsque la distribution des paramtres sloigne de la normalit (Bushway, Brame, & Paternoster, 1999). De plus, puisque la distribution des paramtres est continue, cette mthode ne permet pas didentifier objectivement des points de coupures qui permettraient disoler certains sous-groupes de trajectoires qualitativement distinctes. Ces modles ne sont donc pas adapts aux questions de recherche manant de thories catgorielles du dveloppement. Par exemple, certaines thories sur lvolution des comportements dlinquants soutiennent que la population serait compose de trois patrons dvolution typiques, la majorit des gens ne prsentant jamais de comportements dlinquants, certains en manifestant pendant une priode limite ladolescence et, finalement, une minorit qui maintiendrait ce type de comportements tout au long de leur vie (Moffit, 1993). Si plusieurs patrons dvolution
12/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

36

existent au sein de la population, ils ne seront pas ncessairement dgags par le modle mixte paramtrique. Mme sil est certainement justifi de supposer un patron dvolution commun dans plusieurs instances, il demeure que dans certains cas, rsumer lensemble des trajectoires par une forme moyenne unique nest pas appropri (Raudenbush, 2001b; von Eye & Bergman, 2003). En effet, mme si la courbe moyenne peut reprsenter une synthse utile, il est possible quelle ne corresponde en ralit aucune des trajectoires observes. Par exemple, une trajectoire moyenne horizontale serait obtenue dans un cas o une moiti de la population prsente une trajectoire ascendante avec un statut initial faible et o une autre moiti prsente le patron inverse, avec un statut initial lev et une pente descendante. Le modle mixte non paramtrique permet didentifier ces patrons distincts (Land & Nagin, 1996; Nagin, 1999; Nagin & Land, 1993). Ce modle est aussi appel modle de mlange semiparamtrique (Nagin, 1999) ou encore analyse de classe latente pour courbes de croissance (Muthn, 2001). Ce modle donne la possibilit dtudier les phnomnes qui, comme la dlinquance, peuvent voluer selon des patrons varis. Il est conu expressment afin de dceler la prsence de sous-groupes distincts parmi un ensemble de trajectoires. Il reprsente un compromis intressant entre les analyses autour dune trajectoire moyenne unique et les tudes de cas (von Eye & Bergman, 2003).

Description gnrale
37

Le modle mixte non paramtrique peut tre considr comme un modle deux niveaux (Raudenbush, 2001a). Comme dans les modles mixtes paramtriques, le premier niveau reprsente un ensemble de trajectoires individuelles dcrites par une fonction mathmatique, polynomiale ou autre. La distinction entre les deux types de modles se situe au deuxime niveau, dans la faon de conceptualiser la distribution des variations interindividuelles au sein de la population. Plutt que destimer la variabilit autour de paramtres moyens en postulant une distribution normale, les trajectoires sont conceptualises comme appartenant un nombre fini de sous-groupes relativement homognes. Chaque sous-groupe est dfini par une quation diffrente avec une ordonne lorigine et une pente propre (voir figure 3). Donc, aucune contrainte quant la forme de la distribution des paramtres nest impose. Plutt, une approximation de cette distribution inconnue est obtenue de faon non-paramtrique, en estimant un nombre fini de sous-groupes. La variabilit autour des paramtres lintrieur de chacun des sous-groupes nest pas modlise. Par contre, la proportion de la population appartenant chacun de ces sous-groupes est estime. Il est galement possible de dterminer, pour chaque individu, la probabilit dappartenir lun ou lautre des sousgroupes. partir de cette probabilit, un individu peut tre assign la trajectoire de dveloppement qui correspond le mieux son volution personnelle. Finalement, cette mthode permet dexaminer les relations entre lappartenance un sous-groupe et certaines caractristiques individuelles ou environnementales. Par exemple, lappartenance un groupe prsentant une trajectoire de dlinquance chronique pourrait tre associe au fait dtre de sexe masculin.
Figure 3 : Exemple de trajectoires issues du modle mixte non paramtrique - Trois groupes distincts sont prsents : 1) un groupe toujours lev; 2) un groupe faible au dpart avec acclration; et 3) un groupe toujours faible

Avantages
bms.revues.org/index408.html 13/24

08/03/12
38

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

39

40

41

Cette mthode possde les avantages associs une plus grande flexibilit des postulats distributionnels. Elle vite les biais du modle paramtrique lorsque la distribution de lhtrognit non-observe sloigne de la normalit. Sur le plan thorique, cette approche permet daborder des questions de nature catgorielles ou typologiques, puisquelle identifie des sous-groupes de trajectoires distinctes dfinies par des fonctions diffrentes. Comparativement aux mthodes de classification subjectives, le modle mixte non paramtrique prsente lavantage de fournir un cadre formel pour tester lexistence de groupes de trajectoires distincts. Autrement dit, cette mthode ne prsume pas a priori quil existe ncessairement plus dun groupe dans la population. Plutt, un indice dajustement est utilis afin de dterminer le nombre de sous-groupes optimal (voir section sur lajustement). Ceci reprsente un progrs important comparativement dautres mthodes catgorielles qui dterminent le nombre de groupes sur une base uniquement subjective (von Eye & Bergman, 2003). De plus, cette mthode permet dvaluer la prcision de lassignation des individus au sein des sous-groupes, et de tenir compte de la variation de cette prcision lors danalyses subsquentes. Le modle mixte non paramtrique permet dexaminer linfluence de variables indpendantes sur les trajectoires individuelles. Premirement, une fois lassignation effectue, il est possible de prdire lappartenance lun ou lautre des groupes partir de caractristiques individuelles ou environnementales fixes. Deuximement, limpact de covariables qui varient dans le temps peut tre modlis dans chacun des groupes. Ce type de modle permet de vrifier si linfluence des covariables est similaire ou diffrente selon le groupe dappartenance. Dans le cas de la dlinquance, il est possible que les covariables qui varient dans le temps aient une influence moins importante sur le groupe qui prsentent un niveau lev de comportements dlinquants tout au long de leur vie que pour les autres groupes (Lacourse, Dupr, Nagin, & Tremblay, 2004; Nagin & Paternoster, 2000), par exemple un groupe ou les comportements dlinquants apparaissent ladolescence et sont limits cette priode. Il serait beaucoup plus difficile de dgager des observations de ce genre laide dun modle mixte paramtrique. Lorsque des considrations thoriques ou empiriques suggrent la possibilit de groupes suivant des trajectoires de formes qualitativement distinctes qui ne peuvent tres aisment reprsentes par un continuum, le modle mixte non paramtrique peut enrichir grandement linterprtation des rsultats. Toutefois, lorsque les groupes identifis suivent une forme de trajectoire commune qui varie seulement en lvation, il est possible que les rsultats soient trs similaires ceux obtenus partir du modle mixte paramtrique.

Postulats
42

43

Dans le modle mixte non paramtrique, il nest pas attendu que la distribution des variations interindividuelles soit normale. En fait, une forme distributionnelle multinomiale nest reprsente au niveau 2. Plutt, les groupes de trajectoires reprsentent une approximation dune distribution sous-jacente inconnue. Mathmatiquement, ceci se traduit par une procdure non-paramtrique o la distribution sous-jacente des paramtres est reprsente par un ensemble discret (Heckman, 1981; Heckman & Singer, 1984; Nagin, 1999; Nagin & Tremblay, 1999). Dans les faits, il est impossible de savoir si les paramtres se distribuent approximativement normalement ou sloignent sensiblement de la normalit. Par contre, certains indices peuvent tre utiles. Par exemple, la normalit distributionnelle
14/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

des paramtres est moins probable lorsque les variables observes ne se distribuent pas normalement (Bushway et al., 1999). Par exemple, les scores observs de dlinquance suivent souvent une distribution censure par la gauche (une distribution est dite censure par la gauche lorsquun trop grand nombre dindividus obtiennent un score nul ou trs faible pour que la distribution soit de forme normale). Il est donc possible quune tendance similaire affecte la distribution des paramtres dcrivant les trajectoires de dlinquance . Dans de tels cas, il peut tre particulirement pertinent de comparer les rsultats obtenus partir du modle mixte paramtrique ceux obtenus avec le modle mixte non paramtrique, afin dvaluer la sensibilit des conclusions aux postulats distributionnels.

quations
44

Si lon suppose une distribution normale pour les donnes observes, alors lquation gnrale du modle mixte non paramtrique devient :
Equation 10 :

45

Lquation gnrale ressemble celle du modle paramtrique (voir quations 5 et 6), quelques diffrences prs. Dabord, un indice supplmentaire j est ajout. Cette modification exprime le fait que le modle mixte non paramtrique permet la spcification de j sous-groupes de trajectoires, chacun associs une origine et une pente propre. De plus, la partie stochastique de lquation se limite maintenant au terme derreur lmentaire (eti), puisque les variations interindividuelles au niveau 2 sont maintenant estimes partir dune distribution discrte reprsente par les diffrents sous-groupes j plutt qu partir dune fonction normale continue reprsente par les effets alatoires. Autrement dit, le changement intraindividuel au niveau 1 est reprsent de la mme manire dans les deux modles, par une quation dcrivant lvolution en fonction du temps. La distinction se retrouve plutt au niveau 2, dans la manire destimer la distribution des trajectoires individuelles au sein de la population. Dans le modle mixte non paramtrique, des indices supplmentaires sont extraits lors de lestimation du modle, afin (1) didentifier la proportion de la population appartenant chaque groupe de trajectoires et (2) destimer a posteriori la probabilit, pour chaque individu i, de se retrouver dans lun ou lautre des groupes de trajectoires. Plus spcifiquement, les donnes observes pour un individu i sont utiliss afin de calculer la probabilit que cet individu appartienne chacun des groupes identifis. partir de ces probabilits, les individus peuvent tre assigns au groupe qui correspond le mieux leur trajectoire individuelle observe (Nagin, 1999; Nagin & Tremblay, 1999). De plus, la probabilit dappartenir chacun des groupes en comparaison un groupe de rfrence, conditionnelle un ensemble de covariables fixes, peut tre prdite partir de la rgression logistique multinomiale (Maddala, 1983). Par exemple, si lobjectif est destimer dans quelle mesure le fait dtre de sexe masculin influence la probabilit de se retrouver dans un groupe j caractris par une trajectoire leve de comportements dlinquants tout au long de ladolescence plutt que dans un groupe de rfrence ne manifestant jamais ce type de comportements, lquation de rgression multinomiale serait :
Equation 11 :

46

bms.revues.org/index408.html

15/24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

47

o !j reprsente la probabilit dappartenir au groupe de trajectoire j conditionnel la covariable tre un garon (GAR) et o "j est un paramtre qui capture limpact de la covariable dintrt sur la probabilit dappartenir ce groupe de trajectoires. Le groupe de contraste voit son paramtre " fix zro afin de pouvoir estimer les paramtres de leffet de la covariable pour les diffrents groupes de trajectoires. Lintroduction de covariables qui varient dans le temps se fait selon la mme logique que dans le modle paramtrique, en les ajoutant directement lquation de dveloppement en fonction du temps. Si lon reprend lexemple de lquation linaire avec la frquentation damis dlinquants comme covariable qui varie dans le temps, lquation (10) devient :
Equation 12 :

48

Estimation des paramtres


49

50

51

Comme dans les modles mixte paramtriques, lestimation des paramtres est effectue selon le principe de vraisemblance maximale (maximum likelihood, voir section 3.4.2). Toutefois, une modification est effectue afin de permettre lidentification de sous-groupes de trajectoires prsentant des formes diffrentes (voir Nagin, 1999; Nagin & Tremblay, 1999). Afin de dterminer le nombre de groupes optimal, des indices dajustement ont t dvelopps. Le BIC (Bayesian Information Criterion) est lindice le plus souvent utilis pour le modle non-paramtrique. Il sagit dune mthode ad hoc qui permet de comparer la qualit de la correspondance de plusieurs modles spcifiant chacun un nombre de groupes diffrent. Le modle avec le BIC le plus prs de zro est considr comme celui sajustant le mieux aux donnes. La formule utilise pour calculer le BIC favorise la parcimonie, puisquelle induit une pnalit pour lajout de paramtres, ajout inhrent laugmentation du nombre de groupes. Cet indice tient galement compte de la taille de lchantillon : plus lchantillon est grand, plus la diffrence dajustement entre deux modles devra tre importante pour se traduire en une diffrence sur la valeur du BIC. Il nexiste pas de critres permettant de dterminer si la diffrence entre deux valeurs du BIC est significative ou non. Toutefois, certains indices supplmentaires peuvent tre calculs afin de comparer la probabilit de diffrents modles dtre le modle correct (voir Nagin, 2005). Lutilisation du BIC ne fait pas lunanimit. Dautres indices dajustement, comme le AIC (Akaike Information Criterion) ou le ICL-BIC (Integrated Classification LikelihoodBIC) ont t proposs. Une tude valuant la performance du BIC comparativement ces alternatives montre que le AIC peut tre lgrement suprieur au BIC dans des chantillons plus petit mais quil a parfois tendance indiquer un nombre de groupe trop lev (Brame, Nagin, & Wasserman, 2006). Dans cette tude, le ICL-BIC a dmontr une performance moindre. Lutilisation dun critre statistique objectif comme le BIC pour dterminer le nombre de groupes reprsente un avantage important
16/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

comparativement aux mthodes subjectives de classification. Toutefois, la mthode nest pas infaillible. Il arrive que le BIC ne permette pas de trancher clairement entre diffrents modles. Dans ce cas, des considrations dordre thorique peuvent tre utilises en conjonction avec le critre mathmatique

Application
52

53

54

55

Cette section illustre, par le biais dune application, les diffrences entre le modle mixte paramtrique postulant une distribution continue de lhtrognit non-observe (modlis laide de la procdure SAS PROC NLMIXED), et le modle non paramtrique postulant une distribution discrte de cette htrognit (modlis laide de la procdure SAS PROC TRAJ). Pour les deux types de modles, il est considr que la variable observe suit une distribution de Poisson. La distribution de Poisson est retenue puisque la variable dpendante est un compte du nombre dactes violents survenus au cours dune anne donne. Lchantillon utilis pour cette application est tir de ltude longitudinale de Montral. Il est compos de 1037 garons caucasiens dorigine canadienne-franaise qui proviennent de quartiers dfavoriss de Montral, au Canada. Les participants ont t valus une fois en 1984 (6 ans), puis annuellement de 11 17 ans. Seuls les participants ayant au moins une mesure de la variable dpendante ont t retenus (N = 969). Les autres donnes manquantes sur les covariables ont t imputes laide dune procdure dimputation multiple (SAS PROC MI). Les analyses ont t ralises sur une seule base de donnes complte issue de cette procdure. La variable dpendante est la violence physique autorapporte de 11 17 ans. Lchelle varie entre 0 et 9, les scores levs indiquant davantage de violence physique. Les items utiliss valuent la frquence dapparition, au cours de la dernire anne, de trois comportements : le fait davoir utilis une arme lors dune bataille, davoir particip des batailles entre groupes et de stre battu coups de poing. Lchelle de rponse est de style Likert quatre points dancrage (0=jamais, 1=une ou deux fois, 2=souvent, 3=trs souvent). La moyenne de lchelle chacun des temps de mesure se situe autour de 1 (0,76 1,22; cat-type de 1,22 1,58). La distribution des valeurs est asymtrique avec un mode 0, et ce, tous les temps de mesure. Bien que ce type dchelle ne reprsente pas proprement parler un compte du nombre dactes violents, les scores suivent tout de mme une distribution de Poisson. Trois covariables fixes mesures 6 ans sont galement considres. La premire est un indice dadversit (ADV) compos laide de plusieurs caractristiques familiales (statut familial, prestige de la profession, ge la naissance du premier enfant et niveau d'ducation des parents, Tremblay et al., 1991). Il sagit dune variable continue variant entre 0 et 1. Un score plus lev cet indice indique un niveau dadversit plus lev. Les deux autres covariables, lhyperactivit (HYP) et linattention (INAT), ont t mesures laide dun questionnaire complt par lenseignant de maternelle. Celui-ci devait indiquer, sur une chelle de rponse trois points dancrage (0=jamais, 1=parfois, 2=souvent), la frquence dapparition des comportements lists. Lindice dhyperactivit est compos de deux items (agit, ne demeure pas en place; remue, se tortille) ainsi que lindice dinattention (faible capacit de concentration, distrait).

Illustration du modle mixte paramtrique


bms.revues.org/index408.html 17/24

08/03/12
56

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

57

Puisque dans notre exemple, la variable dpendante reprsente la frquence dapparition dvnements rares par unit de temps et suit une distribution de Poisson, la procdure SAS NLMIXED est utilise pour illustrer le modle mixte paramtrique. Cette procdure permet destimer un modle paramtrique non linaire, en postulant par exemple que les donnes observes suivent une distribution de Poisson. Toutefois, il est noter que le postulat concernant la normalit de la distribution des paramtres dans la population (htrognit non-observe), est maintenu mme si les donnes observes peuvent tre modlises partir de diffrentes formes distributionnelles au niveau individuel. Exemple avec SAS PROC NLMIXED. Une srie de modles avec des fonctions de formes diffrentes (linaire, quadratique, et cubique) a t estime avant dinclure les covariables dans lquation. Les statistiques reprsentant le degr dajustement de ces diffrents modles sont listes dans le tableau 1. Deux indices dajustement, le BIC et la statistique de dviance, ont t calculs pour chacun des modles tests. Dabord, un modle constant (modle A) a t estim, puis des termes linaire (modle B), quadratique (modle C) et cubique (modle D) ont t ajouts en squence. Finalement, les covariables reprsentant ladversit familiale (ADV), lhyperactivit (HYP) et linattention (INAT) ont t ajoutes, ainsi quun terme reprsentant une interaction significative observe entre ladversit familiale et lhyperactivit (ADV*HYP, modle D). Tous les modles tests incluent un effet alatoire autour de lorigine. Des modles additionnels ont galement t tests afin de vrifier si les covariables interagissaient avec le temps, mais puisque aucun effet significatif na t dtect, les rsultats ne sont pas prsents (voir Willett et al., 1998 pour une discussion complte de la ncessit d'une vrification systmatique de la prsence d'effets variables en fonction du temps).
Tableau 1 : Indices dajustement (BIC et statistique de dviance) pour les modles mixtes paramtriques estims avec la procdure SAS PROC NLMIXED (N = 969)

Note. ADV = adversit familiale. HYP = hyperactivit. INAT = inattention


58

Les rsultats prsents au tableau 1 indiquent que le modle inconditionnel cubique prsente le meilleur niveau dajustement aux donnes. Effectivement, parmi les modles inconditionnels tests, cest--dire avant dinclure les covariables (modles A D), cest le modle D qui prsente le meilleur ajustement, la fois selon la statistique de dviance et selon le BIC. En comparant la valeur de la statistique de dviance pour les modles quadratique et cubique, on observe que la diffrence est significative, suggrant que lajout du terme cubique permet dobtenir une meilleure reprsentation du processus de changement. Le critre dinformation bayesien (BIC) corrobore le choix du modle cubique, puisque la plus petite valeur du BIC est associe ce modle. Les covariables
18/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

ont donc t ajoutes au modle cubique. Les rsultats dtaills associs ce modle conditionnel final (modle E) sont prsents au tableau 2.
Tableau 2 : Estims des paramtres et de leur erreur standard obtenus avec SAS PROC NLMIXED (N = 969)

Note. ADV = adversit familiale. HYP = hyperactivit. INAT = inattention. ~ p < .10. * p < .05. *** p < .01. *** p < .001.
59

La partie suprieure du tableau 2 rvle que les covariables insres dans le modle ont toutes un effet indpendant significatif ou marginalement significatif sur le statut initial. Ainsi, des niveaux plus levs dadversit familiale et dhyperactivit sont associs une plus grande agressivit auto-rapporte 11 ans. Une tendance marginale similaire est observe pour linattention. De plus, les rsultats montrent que ces diffrence se maintiennent au cours de ladolescence, puisque aucune interaction significative avec le temps na t trouve. Les rsultats indiquent aussi la prsence dune interaction significative entre ladversit familiale et lhyperactivit. Afin de faciliter linterprtation de cet effet interactif, la figure 4 prsente les courbes prdites diffrents niveau de ces deux variables. Lexamen de la figure rvle que leffet de lhyperactivit sur le niveau daggressivit physique est moins marqu chez les adolescents provenant de familles confrontes un niveau lev dadversit. Leffet de
19/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

lhyperactivit est visible surtout pour ceux voluant au sein de familles favorises. Ainsi, dans les familles dfavorises, le degr dagressivit est pratiquement identique peu importe le niveau initial dhyperactivit. Autrement dit, les garons de milieux particulirement dfavoriss tendent tre plus agressifs, quils soient hyperactifs ou non, alors que chez ceux de milieux favoriss, lhyperactivit a un effet important, rehaussant le score prdit dagressivit un niveau similaire celui des garons de milieux dfavoriss. Cet effet dinteraction converge avec les rsultats dautres tudes montrant que les effets sur lagressivits de facteurs psychophysiologiques tels que lhyperactivit sont plus faciles dtecter dans les environnements familiaux favoriss (Raine, 2002). Lorsque les facteurs sociaux prdisposant sont absent, linfluence de traits individuels est plus facilement dtectable.
Figure 4 : Courbes prdites dagressivit physique diffrents niveaux dadversit familiale (adv) et dhyperactivit (hyp), en maintenant constant le niveau dinattention, telles questimes avec SAS PROC NLMIXED (Tableau 2)
60

Dautres observations intressantes se dgagent de lexamen de la figure 4, et illustrent certaines limites de lapproche paramtriques. Dabord, on observe que mme pour des individus prsentant des niveaux de risque bien diffrents au dpart, les courbe prdites demeurent relativement peu diffrencies. Bien quen moyenne, le degr dagressivit physique prdit tend tre plus lev lorsque plusieurs facteurs de risques sont prsents, il est apparent que mme pour ceux qui prsentent des niveaux particulirement levs dhyperactivit et dadversit familiale, llvation de la trajectoire prdite demeure relativement faible. En effet, tout au long de la priode dobservation, la courbe se situe sous la barre des deux points, sur une chelle avec un maximum de 9. De plus, non seulement llvation des courbes est relativement peu diffrencie, mais la forme des trajectoires prdites obtenues diffrents niveau des facteurs de risque est galement trs similaire. Ceci sexplique par la fait que dans ce type de modle, les facteurs de risque sont utiliss pour dcrire les diffrences individuelles en terme dlvation et changement autour dun patron dvolution commun. Ce type de modlisation autour dune tendance centrale est susceptible dtre particulirement appropri lorsque le phnomne tudi volue de faon similaire, bien qu un rythme variable, pour lensemble de la population. La maturation physique ou lacquisition du langage sont des exemples de processus qui suivent typiquement une courbe ascendante, et pour lesquels il est raisonnable de postuler une variation continue autour dune tendance centrale. Par contre, il est moins clair que ce type de modlisation est bien adapt un phnomne comme lagressivit physique, pour lesquels il nexiste pas de patron facilement applicable lensemble de la population. Dans de tels cas, le modle non paramtrique peut offrir une alternative intressante.

Illustration du modle mixte non paramtrique


61

Exemple avec SAS PROC TRAJ. Dans les modles mixtes non paramtrique, le BIC est utilis afin de dterminer le nombre optimal de groupes, ainsi que la forme des trajectoires. Pour lexemple, un modle 6 groupes (trois fonctions linaires et trois fonctions quadratiques) a t retenu sur la base de cet indice. Le tableau 3 prsente les rsultats obtenus avec ce modle. De plus, une illustration graphique des rsultats est prsente la figure 5.
Tableau 3 : Estims de la proportion de la population, des parameters et erreurs standard pour chacun des 6 groupes (SAS PROC TRAJ, N = 969)

bms.revues.org/index408.html

20/24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

62

Note. ADV = adversit familiale. HYP = hyperactivit. INAT = inattention. Ref = groupe de rfrence. ~ p < .10. * p < .05. *** p < .01. *** p < .001.

Figure 5 : Trajectoires dagressivit physique estimes avec SAS PROC TRAJ (Tableau 3)
63

La variabilit des formes des trajectoires ainsi que la grandeur de la fourchette dlvation couverte sont deux aspects importants qui distinguent les trajectoires obtenues laide de la mthode non paramtrique (figure 5) de celles obtenues prcdemment avec la mthode paramtrique (figure 4). En terme dlvation, alors que les groupes composs dindividus ne rapportant en aucun temps une frquence leve de comportements violents (groupes 1, 2 et 3, reprsentant plus des deux tiers de lchantillon), voluent des niveaux comparables ceux des courbes prsentes la figure 4, les courbes dcrivant lvolution des autres groupes (groupes 4, 5 et 6) atteignent des niveaux nettement plus levs. Ces groupes se distinguent galement quant la forme de leur trajectoires respectives. En effet, alors que les groupes plus faibles suivent une trajectoire linaire dclinante se rapprochant de celles dcrites par les courbes obtenues avec le modle paramtrique (figure 4), dautres groupes suivent des patrons qualitativement diffrents. Par exemple, le quatrime groupe suit une tendance ascendante, alors que le sixime groupe prsente un niveau lev de comportements agressifs tout au long de la priode dobservation. La forme de ces
21/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

64

65

trajectoire sapparente aux patrons dvolution dcrits par Moffitt (1993), o il est attendu quune section de la population prsente des comportements agressifs pendant ladolescence seulement, alors que seulement une petite partie de la population est susceptible de prsenter ce type de comportement de faon soutenue. Lobservation de tels patron dvolution bien distincts suggre que les trajectoires moyennes obtenues laide de procdures postulant une distribution continue de lhtrognit ne constituent pas une reprsentation fidle de la varit des trajectoires individuelles dans cet chantillon. Habituellement, les thories catgorielles comme celle de Moffit (1993) ne se limitent pas dcrire des patrons dvolution spcifiques pour diffrents sous-groupes. Elles prdisent galement que diffrents facteurs explicatifs seront lorigine de ces patrons dvolution distincts. Autrement dit, dans le cas qui nous intresse, des facteurs de risque diffrents seront associs un patron o les comportements apparaissent plus tard et sont limits ladolescence (groupe 4) comparativement un patron dagressivit plus chronique (groupe 6). Selon Moffit (1993), les facteurs de risque individuels apparaissant tt au cours du dveloppement jouent un rle tiologique plus importants dans le dveloppement de problmes dagressivit chroniques, alors que les facteurs de risque environnementaux apparaissant plus tard sont fondamentaux pour expliquer lmergence de comportements dviants limits ladolescence. De faon gnrale, les rsultats prsents dans le tableau 3 sont conformes aux prdictions de cette formulation thorique. En effet, les facteurs de risque prcoces, soir la prsence dadversit familiale et dhyperactivit lge de 6 ans, ainsi que leur effet interactif, prdit plus efficacement lappartenance au groupe suivant une trajectoires dagressivit chronique (groupe 6) que lappartenance au groupe dont les comportements agressifs mergent ladolescence et sont probablement limits cette priode (groupe 4). Puisque les comportements agressifs des membres de ce groupe ne sont pas stables et apparaissent relativement tard au cours du dveloppement, il serait probablement ncessaire de considrer lapport de covariables qui varient dans le temps (ex. : appartenance un groupe de pairs dviants) afin de comprendre et dexpliquer lvolution de ce groupe. Cette section montre que les observations tires du modle non paramtrique peuvent tre qualitativement diffrentes de celles obtenues laide du modle paramtrique. Lorsque leffet des facteurs de risque nvolue pas de faon linaire dun groupe lautre selon leur lvation respective, le modle non paramtrique permet de dgager les effets diffrentiels en fonction du type de trajectoire beaucoup plus aisment que ne le permet un modle paramtrique plus classique. En rsum, si leffet de certaines covariables se concentre dans une rgion particulire de la surface de rponse, le modle non paramtrique peut savrer utile afin de raffiner linterprtation.

Conclusion
66

67

Les modles mixtes paramtrique et non paramtrique sont des outils statistiques conus pour tudier le changement. Ces mthodes partagent une base commune, la trajectoire de dveloppement individuelle. Lutilisation des trajectoires reprsente une grande amlioration comparativement aux mthodes traditionnelles danalyse du changement. Les deux modles mixtes prsents se distinguent quant leur modlisation de la distribution des trajectoires latentes au sein de la population. En effet, la flexibilit des postulats distributionnels associs aux deux modles prsents diffrent grandement. Le modle mixte paramtrique postule dune
22/24

bms.revues.org/index408.html

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

68

69

70

distribution normale des paramtres au sein de la population. Il sagit l dun postulat plutt contraignant dans les situations o la normalit distributionnelle est moins probable. Dans un tel cas, les estims issus de ce modle peuvent tre biaiss. Le modle mixte non paramtrique nimpose pas de forme prcise pour la distribution des paramtres. Une distribution discrte est utilise comme une approximation non paramtrique de la distribution sous-jacente relle de forme inconnue. Dans les faits, il est probable que cette distribution soit continue, mais il est impossible de dterminer sa forme exacte. La force du modle non paramtrique est justement quil nimpose pas de forme paramtrique prcise la distribution des variations interindividuelles. Un autre avantage de ce modle, dcoulant directement de lutilisation dune distribution discrte au deuxime niveau, est quil offre un cadre formel pour tudier les questions de recherches de nature typologique. Il a t dmontr que certains problmes peuvent survenir avec le modle non paramtrique lorsque des covariables influenant le niveau doccurrence dun vnement sont omises, par exemple la mortalit et lincarcration (Eggleston et al. , 2004). Toutefois, il est important de mentionner que linfluence ngative de ces omissions sur la validit du modle nest pas restreinte ce modle et affecte galement le modle paramtrique (Nagin, 2004). De plus, Eggleston et ses collaborateurs (2004) ont observ que ltendue de la priode dobservation peut avoir une influence considrable sur le nombre de groupes, la forme des trajectoires et lassignation des individus aux groupes. Autrement dit, lextrapolation au-del de la priode dobservation est un exercice risqu. Encore une fois, cette problmatique nest pas propre au modle mixte non paramtrique. En fait, il ne sagit pas l dun rsultat contradictoire la logique de ce modle puisque lorsque ltendue des observations varie, il est naturel que le nombre de groupe ncessaire lapproximation de la distribution des variations interindividuelles puisse changer (voir Nagin, 2004). Afin dvaluer limpact des restrictions imposes par chacune des mthodes, Bushway, Brame et Paternoster (1999) recommandent de comparer les rsultats obtenus partir de plusieurs mthodes. Ceci permet de vrifier la robustesse des rsultats ainsi que leur sensibilit aux diffrents postulats. Dans les cas o les rsultats sont diffrents dune mthode lautre, il est plus prudent dutiliser les rsultats obtenus partir de lapproche dont les postulats sont moins restrictifs, soit lapproche non paramtrique. Dans les cas o les rsultats sont similaires, le modle mixte paramtrique peut tre retenu, par souci de parcimonie et defficacit. Sur le plan thorique, la nature du phnomne observ doit galement tre prise en considration lors du choix du modle. En effet, lapproche paramtrique permet de modliser les phnomnes o une tendance moyenne peut, en principe, reprsenter adquatement lvolution de lensemble de la population, alors que lapproche catgorielle sert modliser les phnomnes o diffrents sous-groupes prsentent des patrons de comportement qualitativement diffrents. En rsum, la validit des modles pour dcrire un phnomne en volution dpend de sa correspondance avec les donnes, mais aussi de son association avec une reprsentation thorique crdible.

Notes
1 La notation de Bryk et Raudenbush (1992) est prfre afin de faciliter la prsentation subsquente du modle mixte paramtrique. 2 Habituellement, certains paramtres sont fixs zros dans le modle nich.

bms.revues.org/index408.html

23/24

08/03/12

Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel

Pour citer cet article


Rfrence lectronique

Vronique Dupr, Eric Lacourse, Frank Vitaro et Richard E. Tremblay , Mthodes danalyse du changement fondes sur les trajectoires de dveloppement individuel , Bulletin de mthodologie sociologique, 95 | 2007, [En ligne], Mis en ligne le 01 juillet 2010. URL : http://bms.revues.org/index408.html. Consult le 08 mars 2012.

Auteurs

Vronique Dupr Eric Lacourse


Articles du mme auteur
An Inquiry into the Efficacy of a Complementary Training Session for Telephone Survey Interviewers [Texte intgral]
Paru dans Bulletin de mthodologie sociologique, 92 | 2006

Frank Vitaro Richard E. Tremblay


Universit de Montral; eric.lacourse@umontreal.ca

Droits d'auteur
BMS

bms.revues.org/index408.html

24/24