Beruflich Dokumente
Kultur Dokumente
Mthodes quantitatives pour valuer les interventions visant amliorer les pratiques
Octobre 2006
Juin 2007
Ce document a t valid par le Collge de la Haute Autorit de sant en juin 2007. Haute Autorit de sant 2007
Sommaire
Introduction ................................................................................................ 3 Mthodes quantitatives pour valuation de l'impact d'interventions visant amliorer les pratiques............................................................... 5 1. Les essais contrls randomiss ................................................... 7 1.1 Essais randomiss unit de randomisation individuelle................. 7 1.2 Essais randomiss unit de randomisation collective (essais en cluster, essais en grappes).......................................................................... 7 2. 2.1 2.2 tudes quasi exprimentales .......................................................... 16 Sries chronologiques ....................................................................... 16 tudes avant/aprs avec site contrle contemporain de l'intervention ........................................................................................................ 20 Autres particularits mthodologiques des tudes dintervention ........................................................................................................... 22 Standardisation de l'intervention ....................................................... 22 Critres de jugement ou indicateurs.................................................. 22 Aveugle.............................................................................................. 23 Sources de donnes ......................................................................... 23
Concevoir et mettre en uvre une tude................................................ 25 1. 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 2. 2.1 2.2 2.3 Avant la ralisation de ltude ......................................................... 25 La formulation du problme............................................................... 26 Dtermination de la population-cible ................................................. 29 Mthodes de recrutement ................................................................. 30 Choix de la stratgie damlioration .................................................. 30 Choix du plan dtude exprimental ou dobservation ...................... 32 Choix des indicateurs ou critres de jugement ................................. 33 Aspects thiques ............................................................................... 36 Enregistrement de ltude ................................................................. 36 Durant la ralisation de ltude........................................................ 37 Maintien de lintrt des participants aprs le recrutement............... 37 Scurit et effets indsirables ........................................................... 37 Gestion des donnes ........................................................................ 38
3. 3.1 3.2
Rfrences ..................................................................................................41 ANNEXE 1 : Cochrane Effective Practice and Organisation of Care Group (EPOC).........................................................................................................43 ANNEXE 2 : Grille de choix des thmes de travail .................................46 ANNEXE 3 : Analyse critique dune tude dintervention ......................47 Fiche descriptive ........................................................................................55
Introduction
La Haute Autorit de Sant remercie le Pr Philippe RAVAUD et le Dr Pierre DURIEUX, auteurs de ce guide. Les interventions destines amliorer la qualit des soins sont trop souvent mises en place sans prvoir lvaluation de leur impact ou en valuant cet impact, avec une mthodologie dont on sait demble quelle ne permettra pas de rpondre correctement la question. Sur les quelques centaines dtudes dinterventions rfrences par le groupe de travail EPOC (Effective Practice and Organization of Care) de la collaboration Cochrane, moins dune dizaine ont t ralises en France (1,2). Ceci est galement vrai pour les politiques visant modifier les comportements, les mises en place, sans que lvaluation de leur impact ait t srieusement envisage (3,4). valuer correctement les interventions destines amliorer la qualit des soins et modifier les comportements est pourtant essentiel, afin de savoir quelles interventions sont susceptibles dtre efficaces dans notre systme de sant, en contribuant ainsi dune part lamlioration de la qualit des soins, et dautre part lamlioration de notre politique de sant. Ces interventions sont fondes le plus souvent sur une modification de la pratique professionnelle ou de lorganisation des soins. Lorsquelles sont en phase de dveloppement, elles doivent faire, linstar de toute innovation, lobjet dune valuation de ses effets positifs et ngatifs, avant dtre gnralises. Cette valuation est fonde principalement sur des mthodes quantitatives, domaine de l'pidmiologie et des biostatistiques. Cependant, les mthodes qualitatives, issues des sciences humaines et sociales, sont actuellement en plein dveloppement, pour aider la prise en compte des freins l'amlioration des pratiques, pour faciliter le choix d'une stratgie d'intervention adapte ou pour analyser les raisons de l'chec d'une intervention. Ce document prsente les approches quantitatives uniquement. Les mthodes proposes dans ce document sont appliques dans un cadre de recherche, et ne sont pas ncessaires lors de l'utilisation routinire de ces interventions. Leur utilisation contribue, cependant, faire en sorte que les interventions mises en place pour amliorer les pratiques mdicales aient fait l'objet d'une valuation avant leur utilisation routinire. Lobjectif de ce document est, partir des donnes de la littrature mdicale scientifique et de lexprience de ses auteurs, de prsenter les diffrentes mthodes quantitatives dvaluation des interventions, destines amliorer la qualit des soins. Il en dcrit oprationnellement les diffrentes tapes de mise en uvre. La stratgie de recherche documentaire a donc t cible sur la mthodologie de ces tudes. Les bases bibliographiques des auteurs/experts du rapport ont t exploites. Ces bases sont alimentes par une veille documentaire systmatique : - dans PubMed/Medline, partir des termes : Cluster randomised controlled OU trial time series analysis OU time-series intervention analysis OU analysis of interrupted time series OU Interrupted time series design OU interrupted time-series analysis OU interrupted time series studies OU alternating time series analysis OU controlled "before-after" study OU pre/post study ; - ainsi que par le dpouillement des revues suivantes : BMJ, The Lancet, Annals of Internal Medicine, JAMA, Statistics in Medicine, BMC Health Services Research, American Journal of Public Health, International Journal of Technology Assessment in Health Care, Quality Safety Health Care, International journal for quality in health care.
HAS/Service des recommandations professionnelles/Juin 2007 3
Ce guide constitue avant tout un cadre de rfrence pour les chercheurs. Il vise soutenir le dveloppement actuel de la recherche sur les systmes de sant, soutenue notamment par les appels projets de recherche de la HAS, de la CNAMTS, de la DHOS (appel projet PrEQHos). Il est une aide aux dcideurs et professionnels de sant appels expertiser les projets de recherche portant sur une valuation dintervention. Ce guide constitue galement un document de rfrence pour la lecture critique utile aux professionnels de terrain. Il fait cependant rfrence des concepts, mthodes et outils complexes qui ne sont pas dvelopps, et qui peuvent ncessiter laide de mthodologistes. Nous esprons cependant qu sa lecture, le professionnel de sant soit sensibilis limportance de lvaluation rigoureuse dune intervention innovante, qui conditionnera peut-tre sa pratique de demain.
Mthodes quantitatives pour valuation de l'impact d'interventions visant amliorer les pratiques
Lorsque lon met en place une intervention destine modifier une pratique, et amliorer la qualit des soins, il apparat logique de mesurer ltat de cette pratique avant et aprs la mise en place de lintervention, et de conclure lefficacit de lintervention si la pratique sest amliore entre les deux mesures. En ralit, en raison de tendances prexistantes lamlioration ou de variations lies une autre cause que lintervention, il est difficile, voire impossible, d'attribuer les variations observes l'intervention (figure 1). Il a de plus t suggr que les rsultats des tudes avant/aprs pouvaient surestimer les effets des interventions ayant pour but d'amliorer la qualit des soins (5). Les tudes avant/aprs, trs (trop) souvent ralises, ne devraient donc pas tre utilises pour valuer limpact dune intervention. Ce type dtude permet simplement de montrer lvolution dune pratique, sans que l'on puisse affirmer que les modifications observes sont lies l'intervention. valuant limpact dune confrence de consensus sur le cancer de la prostate, Kosecoff et al., en 1987, avaient ainsi montr que les pratiques recommandes (chirurgie dans le cancer localis) staient amliores aprs la publication des recommandations de la confrence, mais quil sagissait en ralit dune tendance lamlioration prexistante. Lorsque lon analysait les donnes sur une priode prolonge, et non pas simplement par un point de mesure avant et un point de mesure aprs intervention, il tait observ que la publication des recommandations navait eu aucun impact sur les pratiques (cf. figure 1) (6). Personne ne discute aujourdhui que lessai contrl randomis constitue la rfrence pour valuer lefficacit dun nouveau mdicament. Il en est aujourdhui de mme pour toute intervention sur la sant. Dans le cas de lvaluation dun mdicament, la mesure des rsultats de sant se fait sur la cible de lintervention (dans les deux cas, il sagit du patient). Lune des spcificits de lvaluation des interventions damlioration des pratiques et de changement des comportements est que la cible de lintervention est collective (un groupe de mdecins, dtablissements, etc.), alors que la mesure des rsultats de sant est lchelle des patients. Cette spcificit fait que lessai contrl randomis sera le plus souvent ralis en clusters (ou en grappes). Cest pourquoi nous dveloppons longuement ce schma exprimental de rfrence. Cependant, des schmas dits quasi exprimentaux (tude avant/aprs avec groupe-contrle, srie chronologique) peuvent tre envisags lorsque des barrires politiques, thiques ou organisationnelles empchent la ralisation dun essai.
Figure 1. tude avant/aprs. Les variations observes entre fvrier 2004 et avril 2004 (partie a) peuvent n'tre lies qu' la tendance prexistante.
Avant Intervention
% d'adquation aux recommandations
Aprs
Intervention
% d'adquation aux recommandations
Fv 2003 Fv Avril 2004 2004 Avril 2005 Fv 2006
1.2 Essais randomiss unit de randomisation collective (essais en cluster, essais en grappes)
Dans ce type d'essai, ce ne sont donc plus des individus qui sont randomiss, mais des groupes d'individus (hpitaux, services hospitaliers, units de soins, mdecins, infirmires, etc. [cf. figure 2]), ce qui est finalement logique, puisque cest eux que lintervention est destine. La randomisation a donc lieu un niveau collectif (mdecins,
HAS/Service des recommandations professionnelles/Juin 2007 7
services, etc.), et les donnes sont recueillies gnralement un niveau diffrent (malade).
Figure 2. Comparaison entre le mode de recrutement des individus et de randomisation, dans les essais unit de randomisation individuelle et dans ceux unit de randomisation collective
Hpital
Hpital
A E
B F
C G
D H
I M
J N
K O
L P
A J
C K
D M
G P
B I
E L
F N
H O
Bras intervention
Bras contrle
Essai contrle randomis en grappes Hpital 1 Hpital 2 Hpital 3 Hpital 4 Hpital 5 Hpital 6
A C
B D
E G
F H
I K
J L
M O
N P
Q S
R T
U W
V X
Hpital 1
Hpital 4
Hpital 5
Hpital 2
Hpital 3
Hpital 6
A C
B D
M O
N P
Q S
R T
E G
F H
I K
J L
U W
V X
Bras intervention
Bras contrle
L'avantage majeur des essais en cluster est de limiter ou d'viter le risque de contamination, cest--dire le risque, par exemple que les mdecins randomiss dans le bras-tmoin soient influencs par les professionnels du bras-intervention, et amliorent leurs pratiques. La contamination peut entraner une sous-estimation de l'effet rel de l'intervention, et augmenter le risque d'erreur de type II. Le nombre de cluster tant souvent faible, il est souvent utile de prendre en compte la performance initiale, avant intervention.
HAS/Service des recommandations professionnelles/Juin 2007 8
1.2.1
La mesure de l'tendue de l'effet cluster ou grappes est appele Coefficient de corrlation intraclasse (CCI). Ce coefficient value le degr de ressemblance des individus au sein d'une grappe, et est bas sur la relation entre la variance entre clusters et la variance intracluster. Pour cette raison, les tailles des chantillons doivent tre majores pour tenir compte de l'effet de mise en grappes. L'augmentation requise est influence la fois par le CCI et par la taille des grappes. On doit augmenter la taille standard de l'chantillon par un facteur d'inflation gal [1 +(n -1) ], o n est la taille moyenne d'une grappe et le CCI estim. On peut obtenir le nombre de participants supplmentaires en augmentant soit le nombre de grappes dans l'tude, soit le nombre de participants par grappe. Toutefois, l'augmentation de la taille de la grappe plus de 50 ne permettra d'amliorer que lgrement l'efficacit statistique, l'augmentation du nombre de grappes sera beaucoup plus efficace (8). Il faut ainsi faire un choix entre les difficults logistiques et les cots associs au recrutement de nouvelles grappes, et les difficults associes l'augmentation du nombre de patients par grappe. Si le nombre de grappes est faible (< 5), quelque soit la taille de chaque grappe, on peut dans certaines circonstances ne pas atteindre une puissance de 80 % (cf. figure 3). Le coefficient de corrlation intraclasse varie selon le type de critres de jugement utilis. Plus le CCI est lev, plus leffet cluster sera important (un CCI 0 signifie quil nexiste aucun effet cluster). Les valeurs du CCI sont plus leves pour les critres de jugement de type procdure (valeur mdiane 0,063, cart interquartile : 0,016 0,124) que pour les critres de jugement de type rsultat (valeur mdiane 0,030, cart interquartile 0,005 0,052). Ces CCI varient probablement aussi selon d'autres paramtres : le contexte de soins (CCI plus faible en soin primaire), l'unit de randomisation, le type de mesure subjective ou objective (9-12). Pour les calculs d'effectifs, il est ncessaire de faire des hypothses propos du CCI retenu. Ces hypothses seront faites en fonction des paramtres connus pour influer sur le CCI, des CCI retrouvs dans des tudes prcdemment publies, des rsultats d'tudes prliminaires ventuelles. Il est prudent de faire varier le CCI, car des erreurs sur ces estimations initiales sont frquentes. la fin de l'tude, il est indispensable, surtout en cas d'tude ngative, de calculer le CCI rel afin de vrifier que l'tude avait une puissance suffisante. Un exemple de calcul de nombre de sujets est donn dans lencadr n1. Une autre difficult, avec les essais unit de randomisation collective, est le risque de dsquilibre ou de non-comparabilit entre les groupes. Si dans les essais unit de randomisation individuelle ce risque est faible, car le nombre d'units de randomisation est lev (frquemment suprieur 100 ou 200), ce risque est majeur dans les essais unit de randomisation collective, o l'on randomise parfois moins de 10 units (hpitaux, structures de soins ou mdecins). Bien videmment, plus le nombre d'units de randomisation disponible est faible, plus le risque d'un dsquilibre d la chance entre les groupes-tmoins et les groupesintervention est lev. Une difficult supplmentaire dans ces essais est reprsente par le biais induit diffrent niveau par l'absence d'aveugle. Il n'est pas rare dans les tudes en cluster que les hpitaux, services ou mdecins qui se voient assigner une intervention qui ne leur convient pas (par exemple s'ils sont randomiss groupe-tmoins) refusent finalement de participer l'tude induisant bien videmment un biais, et aggravant le risque de dsquilibre entre les groupes. Enfin l'analyse des essais en cluster est plus complexe que l'analyse des essais unit de randomisation individuelle. Frquemment, ces essais sont analyss l'chelon individuel sans prendre en compte l'effet du cluster, ce qui est incorrect au plan statistique. Ces essais peuvent tre analyss l'chelon du cluster en utilisant le cluster
HAS/Service des recommandations professionnelles/Juin 2007 9
comme unit de randomisation mais aussi d'analyse. Dans ce cas, une statistique rsume (moyenne ou pourcentage) est obtenue pour chaque cluster. Ces donnes disponibles pour chaque cluster peuvent tre considres comme indpendantes, et analyses en utilisant les tests statistiques usuels. La deuxime mthode qui peut tre utilise est l'analyse des donnes l'chelon individuel, en ralisant un ajustement pour prendre en compte l'effet cluster. La dernire mthode consiste utiliser des techniques de modlisation prenant en compte la nature hirarchique des donnes. Ainsi, pour un essai o sont randomiss des services hospitaliers, on peut utiliser un modle o les malades sont embots dans le service hospitalier, et prenant en compte des covariables mesures l'chelon du malade (ge, sexe, gravit de la maladie) ou du service hospitalier (taille, nombre de mdecins, etc.). Par exemple, afin dvaluer limpact de la mise en uvre dune intervention destine utiliser des rgles de prescription des radiographies de la cheville, chez des patients se prsentant aux urgences de lAssistance publique Hpitaux de Paris pour traumatisme de la cheville (rgles dOttawa), deux hpitaux ont t randomiss intervention , et trois hpitaux ont t randomiss pratique usuelle . Le pourcentage de ralisation de radiographies de cheville a t valu avant et aprs intervention dans les deux groupes dhpitaux. Dans cette tude, lunit de randomisation tait bien lhpital et les donnes taient recueillies auprs des patients, mais il fallait aussi prendre en compte un autre niveau de prise en charge, le mdecin (1 005 patients pris en charge par 44 mdecins dans le groupe-intervention, 906 patients pris en charge par 47 mdecins dans le groupetmoins). Lanalyse statistique, en comparant les pourcentages de ralisation des radiographies chez les patients issus des deux groupes dhpitaux, a ainsi pris en compte la fois leffet hpital et leffet mdecin (en donnant plus de poids aux mdecins qui avaient vu plus de malades), cest--dire deux niveaux de grappes (13). 1.2.2 Types dessais en cluster
Figure 3. Influence de la taille et du nombre de grappes sur la puissance pouvant tre obtenue.
2 00 1 80 1 60 1 40 1 20
CCI 0,020
1 00 80 60 40 20 0 3 6 9 12 15 1 8 21 24 2 7 30 3 3 36 39
2 00 1 80 1 60 1 40 1 20 1 00 80 60 40 20 0 3 6 9 12 15 1 8 21 24 2 7 30 3 3 36 39
CCI 0,050
CCI 0,100
2 00 1 80 1 60 1 40 1 20 1 00 80 60 40 20 0 3 6 9 12 15 1 8 21 24 2 7 30 3 3 36 39
Nombre de grappes par bras dintervention Puissance: 90% 80% 60% 40%
Encadr n Exemple de calcul d'effectif pour les essais unit de randomisation 1 individuelle ou collective
Horbar JD, Carpenter JH, Buzas J, Soll RF, Suresh G, Bracken MB, et al. Collaborative quality improvement to promote evidence based surfactant for preterm infants : a cluster randomised trial. BMJ 2004;329(7473):1004.(14). Objectif : valuer une intervention multifacette d'amlioration de la qualit, pour promouvoir l'utilisation d'un traitement par surfactant chez les enfants prmaturs gs de 23 29 semaines. L'effectif ncessaire sera extrmement diffrent selon le plan exprimental retenu (essai randomisation individuelle ou collective), le type de critre de jugement : 1- Si, essai randomis unit de randomisation individuelle (randomisation de malades) - = 0,05 ; = 0,20. - Critre de jugement de type procdure : % d'enfant recevant du surfactant donn en salle de dlivrance. - Effet attendu de l'intervention (20 % dans le bras cohorte, 50 % dans le bras intervention). Le nombre ncessaire de malades est de 78. 2- Si, essai unit de randomisation collective L'effectif ncessaire augmentera, car il faudra prendre en compte un facteur d'inflation, FI = 1 +(m1), o m est la taille des grappes (nombre d'individus vu par un mdecin par exemple si l'on randomise des mdecins), et est le coefficient de corrlation intraclasse qui quantifie la corrlation entre les malades d'une mme grappe. Si le facteur d'inflation est gal 10, il faudra 10 fois plus de malades dans un essai unit de randomisation collective que dans un essai randomisation individuelle pour obtenir une mme puissance. La valeur du coefficient de corrlation intraclasse dpend en particulier de l'unit de randomisation (les malades suivis par un mme mdecin sont probablement plus ressemblants que les malades suivis au sein d'un hpital) et du type de critre de jugement. Les critres de jugement de type pratique mdicale sont probablement plus corrls au sein d'une grappe (par exemple parmi les malades traits par un mme mdecin) que les critres de jugement de type rsultats, par exemple la mortalit. a unit de randomisation : service. - Critre de jugement de type procdure (surfactant donn en salle de dlivrance). - Coefficient de corrlation intraclasse estim (CCI) 0,31. Le CCI reflte le degr de corrlation ou de ressemblance entre les prescriptions d'un mme service (ou d'un mme mdecin). Si on a 20 services disponibles au total, on ne pourra jamais atteindre une puissance de 80 %, quelque soit le nombre d'enfants inclus dans chaque service (puissance maximum 72 %). Si on a 24 clusters, chacun incluant 375 sujets (9 000 enfants au total), on obtient une puissance de 80 %. Si on a 30 services, il suffit que chacun inclut 9 sujets (270 enfants au total) pour obtenir une puissance de 80 %. Il apparat donc clairement que la puissance de l'essai est plus lie au nombre de services randomiss qu'au nombre de malades inclus dans chaque service. b unit de randomisation : mdecins et critre de jugement de type procdure. - CCI = 0,50 (logiquement plus lev que dans le cas d'une randomisation par service). Si on a moins de 38 clusters (mdecins), la puissance maximale atteinte sera infrieure 80 % quelque soit le nombre de malades vus par chaque mdecin. Si on a 50 mdecins randomiss incluant chacun 4 malades (soit 200 malades au total), la puissance sera de 81,6 %. Si on a 60 mdecins randomiss incluant chacun 2 malades (soit 120 malades au total), la puissance sera de 80 %. c unit de randomisation : mdecins et critre de jugement de type rsultats (mortalit). - CCI 0,01 (le CCI est toujours plus bas pour un critre de type rsultat que pour un critre de type procdure). Il est ncessaire pour mettre en vidence une rduction de la mortalit de 30 % (en prenant l'hypothse que la mortalit est de 20 % dans le groupe-tmoins), avec une puissance de 80 %, d'avoir 20 clusters (mdecins) de 42 malades (840 malades au total) ou 40 clusters de 17 malades (680 malades au total).
HAS/Service des recommandations professionnelles/Juin 2007 12
Objectif : valuer leffet de deux interventions sur le nombre dexamens de laboratoire prescrits par des mdecins gnralistes. Plan exprimental : essai contrl randomis en cluster, avec plan factoriel 2 x 2. Groupe 1 Aucune intervention (tmoin) Groupe 3 Reoit messages ducationnels Groupe 2 Reoit retour d'informations Groupe 4 Reoit retour d'informations + messages ducationnels
Participants : 85 cabinets de mdecins gnralistes du Nord-Est de lcosse. Interventions : document diffus chaque cabinet de mdecins, prsentant leurs donnes de prescription des 3 dernires annes concernant 9 tests biologiques compares aux donnes rgionales (feedback) ; recommandations simples accompagnant chaque rsultat dun des 9 tests biologiques prescrit par un mdecin des cabinets dintervention concerns (message ducationnel). Critre de jugement : nombre dexamens prescrits avant et durant les 12 mois de la priode intervention. Rsultat : baisse du nombre total dexamens denviron 10 % dans le groupe retour d'informations, 10 % dans le groupe messages ducationnels et 20 % dans le groupe retour d'informations + messages ducationnels (effet additif des deux types de messages).
HAS/Service des recommandations professionnelles/Juin 2007 13
1.2.2.4 Modle quilibr incomplet Le schma dit en blocs quilibrs incomplets est frquemment utilis pour viter leffet Hawthorne dcrit plus haut. Le cas le plus simple est un modle de blocs quilibrs incomplets 2 x 2. Dans ce schma exprimental, un groupe reoit une intervention pour la prise en charge du problme de sant ou de la maladie A, et sert de contrle pour la prise en charge de la maladie B. Lautre groupe reoit lintervention pour la maladie B, et sert de contrle pour la maladie A. tant donn que les sujets des deux groupes sont soumis au mme niveau dintervention, l'effet Hawthorne doit tre gal dans les deux groupes. Un exemple de ce type de schma est donn dans lencadr n 3. Encadr n Exemple d'essai randomis en cluster avec plan exprimental de 3 type bloc incomplet.
Eccles M, McColl E, Steen N, Rousseau N, Grimshaw J, Parkin D, et al. Effect of computerised evidence based guidelines on management of asthma and angina in adults in primary care : cluster randomised controlled trial. BMJ 2002;325(7370):941.(16).
Objectif : valuer l'impact d'un systme daide la dcision informatis, pour la mise en uvre de recommandations de pratique clinique concernant la prise en charge de l'asthme et de l'angor chez les adultes, dans le cadre des soins primaires. Plan exprimental : essai randomis pragmatique avec unit de randomisation collective (randomisation de cabinets de mdecins) de type bloc incomplet quilibr. Asthme Mdecins groupe 1 Mdecins groupe 2 Intervention Tmoin Angine Tmoin Intervention
Participants : 60 cabinets de mdecine gnrale du Nord-Est de l'Angleterre. Mdecins gnralistes et infirmiers, dont les mdecins utilisent des systmes informatiss pour leur prescription. Intervention : Mise en place de recommandations informatises permettant de guider la consultation, soit sur lasthme (mdecins du groupe 1), soit sur langor (mdecins du groupe 2). Critre de jugement : Adhsion aux recommandations, fonde sur lanalyse des dossiers, effectue avant et aprs mise en uvre de laide. CCI estim de 0,05. Analyse en intention de traitement, cest--dire que les mdecins ont ou non utilis laide informatique Rsultat : aucun impact de laide informatique sur la qualit de la prise en charge. La nonefficacit de laide semble principalement due au fait que les mdecins ne la consultaient pas.
Pour en savoir plus sur les essais unit de randomisation collective Exemples pratiques Beck CA, Richard H, Tu JV, Pilote L. Administrative Data Feedback for Effective Cardiac Treatment : AFFECT, a cluster randomized trial. JAMA 2005;294(3):309-17. Moher M, Yudkin P, Wright L, Turner R, Fuller A, Schofield T, et al. Cluster randomised controlled trial to compare three methods of promoting secondary prevention of coronary heart disease in primary care. BMJ 2001;322(7298):1338. Ornstein S, Jenkins RG, Nietert PJ, Feifer C, Roylance LF, Nemeth L, et al. A multimethod quality improvement intervention to improve preventive cardiovascular care : a cluster randomized trial. Ann Intern Med 2004;141(7):523-32. Perria C. Strategies for the introduction and implementation of a guideline for the treatment of type 2 diabetics by general practitioners (GPs) of the Lazio region of Italy (IMPLEMEG study) : protocol for a cluster randomised controlled trial ISRCTN80116232. BMC Health Serv Res 2004;4(1):13. Yealy DM, Auble TE, Stone RA, Lave JR, Meehan TP, Graff LG, et al. Effect of increasing the intensity of implementing pneumonia guidelines. A randomized trial. Ann Intern Med 2005;143:881-94. Quelques rfrences mthodologiques Campbell MJ, Donner A, Klar N. Developments in cluster randomized trials and Statistics in Medicine. Stat Med 2007;26(1):2-19. Donner A, Klar N. Design and analysis of cluster randomization trials. Arnold : London, 2000. Donner A, Klar N. Pitfalls of and controversies in cluster randomization trials. Am J Public Health 2004;94(3):416-22. Elbourne DR, Campbell MK. Extending the CONSORT statement to cluster randomized trials : for discussion. Stat Med 2001;20(3):489-96. Murray DM, Varnell SP, Blitstein JL. Design and analysis of group-randomized trials : a review of recent methodological developments. Am J Public Health 2004;94(3):423-32.
Objectif : valuer la mise en place dun programme de visites domicile , auprs des mdecins gnralistes franais, destines amliorer la prise en charge du diabte de type 2. Plan exprimental : suivie en srie chronologique de donnes de prescription issues des bases de donnes de lAssurance maladie, 17 mois avant, 6 mois pendant et 12 mois aprs intervention. Participants : Ensemble des mdecins franais ayant effectu une demande dALD, pour un de leur patient durant la priode de lintervention. Interventions : visites domicile ou entretien tlphonique effectus par un mdecin conseil auprs des mdecins prescripteurs dALD, afin de leur diffuser les recommandations nationales concernant le suivi du diabte de type 2 (notamment la ncessit de doser lHBA1c tous les 4 mois). Critre de jugement : nombre mensuel de prescriptions dHBA1c rapport au nombre total de prescriptions dexamens de laboratoire. Rsultats : la rupture de pente observe durant la priode de lintervention montre son efficacit.
Pour en savoir plus Exemples pratiques d'tudes de type chronologique Black N, Hutchings A. Reduction in the use of surgery for glue ear : did national guidelines have an impact? Qual Saf Health Care 2002;11(2):121-4. Bloor K, Freemantle N, Khadjesari Z, Maynard A. Impact of NICE guidance on laparoscopic surgery for inguinal hernias : analysis of interrupted time series. BMJ 2003;326(7389):578. Foy R, Ramsay CR, Grimshaw JM, Penney GC, Vale L, Thomson A, et al. The impact of guidelines on mild hypertension in pregnancy : time series analysis. BJOG 2004;111(8):765-70. Mol PG, Wieringa JE, Nannanpanday PV, Gans RO, Degener JE, Laseur M, et al. Improving compliance with hospital antibiotic guidelines : a time-series intervention analysis. J Antimicrob Chemother 2005;55(4):550-7. Sheldon TA, Cullum N, Dawson D, Lankshear A, Lowson K, Watt I, et al. What's the evidence that NICE guidance has been implemented? Results from a national evaluation using time series analysis, audit of patients' notes, and interviews. BMJ 2004;329(7473):999. Quelques rfrences mthodologiques Ansari F, Gray K, Nathwani D, Phillips G, Ogston S, Ramsay C, et al. Outcomes of an intervention to improve hospital antibiotic prescribing : interrupted time series with segmented regression analysis. J Antimicrob Chemother 2003;52(5):842-8. Ostrom CW. Time series analysis : regression techniques. London:Sage, 1990. Ramsay CR, Matowe L, Grilli R, Grimshaw JM, Thomas RE. Interrupted time series designs in health technology assessment : lessons from two systematic reviews of behavior change strategies. Int J Technol Assess Health Care 2003;19(4):613-23. Wagner AK, Soumerai SB, Zhang F, Ross-Degnan D. Segmented regression analysis of interrupted time series studies in medication use research. J Clin Pharm Ther 2002;27(4):299-309.
Un exemple de ce type dtude est prsent dans lencadr n 5. Encadr n Exemple d'tude avec srie de priodes alternes 5
Durieux P, Nizard R, Ravaud P, Mounier N, Lepage E. A clinical decision support system for prevention of venous thromboembolism : effect on physician behavior. JAMA 2000;283(21):2816-21. (18)
Objectif : valuer limpact dun systme daide la dcision informatis, pour la prvention des thromboses veineuses dans un service de chirurgie orthopdique. Plan exprimental : Srie chronologique dune dure de 18 mois comprenant 4 priodes dintervention de 10 semaines (systme daide activ) alternant avec 4 priodes tmoins (systme daide dsactiv) de 10 semaines Participants : tous les chirurgiens du service de chirurgie orthopdique Interventions : recommandations pour la prvention des thromboses veineuses informatises. Systme critique, cest--dire intervenant une fois la prescription effectue, pour proposer une modification si la prescription est contraire aux recommandations. Lors des priodes dintervention (I), le systme propose une prescription adapte aux facteurs de risque du malade. Lors des priodes-tmoins (C), le systme ne propose pas de prescription. CI I C I C I C I Critre de jugement : taux d'adquation des recommandations, donnes recueillies automatiquement par le systme dinformations. Rsultats : ladquation aux recommandations augmente lors de chaque priode dintervention, et baisse chaque fois que lon stoppe laide. Il ny a pas deffet ducationnel.
Pour en savoir plus Exemples pratiques d'tudes de type series en priodes alternes Colombet I, Bura-Riviere A, Chatila R, Chatellier G, Durieux P. Personalized versus nonpersonalized computerized decision support system to increase therapeutic quality control of oral anticoagulant therapy : an alternating time series analysis. BMC Health Serv Res 2004;4(1):27. Hay JA, Maldonado L, Weingarten SR, Ellrodt AG. Prospective evaluation of a clinical guideline recommending hospital length of stay in upper gastrointestinal tract hemorrhage. JAMA 1997;278(24):2151-6. Weingarten SR, Riedinger MS, Conner L, Lee TH, Hoffman I, Johnson B, et al. Practice guidelines and reminders to reduce duration of hospital stay for patients with chest pain. An interventional trial. Ann Intern Med 1994;120(4):257-63.
Objectif : valuer limpact de lintroduction de recommandations, sur la prise en charge du cancer du sein et du cancer du colon dans un rseau dhpitaux anticancreux. Plan exprimental : tude avant/aprs contrle. Mise en uvre de recommandations dans les hpitaux de la rgion Rhne-Alpes, une rgion comparable servant de groupe-tmoins. Participants : 15 hpitaux publics et 11 structures prives (rgion-intervention). Interventions : laboration puis diffusion de recommandations au sein du rseau dhpitaux et structures prives de la rgion-intervention. Aucune intervention spcifique dans la rgiontmoin. Critre du jugement : pourcentage dadquation aux recommandations, par analyse dun chantillon de dossiers avant et aprs intervention, dans la rgion-intervention et la rgiontmoin. Rsultat : dans le groupe-intervention, ladquation aux recommandations passe de 12 % 36 % (cancer du sein), et de 14 % 46 % (colon) ; dans le groupe-tmoins, les pourcentages passent respectivement de 6 % 7 %, et de 32 39 %.
Pour en savoir plus Exemples pratiques d'tudes Avant/Aprs Etter JF, Laszlo E. Evaluation of a poster campaign against passive smoking for World NoTobacco Day. Patient Educ Couns 2005;57(2):190-8. Katz DA, Muehlenbruch DR, Brown RB, Fiore MC, Baker TB, AHRQ Smoking Cessation Guideline Study Group. Effectiveness of a clinic-based strategy for implementing the AHRQ Smoking Cessation Guideline in primary care. Prev Med 2002;35(3):293-301. Leape LL, Cullen DJ, Clapp MD, Burdick E, Demonaco HJ, Erickson JI, et al. Pharmacist participation on physician rounds and adverse drug events in the intensive care unit. JAMA 1999;282(3):267-70. Martens JD, Winkens RA, van der WT, de BD, Severens JL. Does a joint development and dissemination of multidisciplinary guidelines improve prescribing behaviour : a pre/post study with concurrent control group and a randomised trial. BMC Health Serv Res 2006;6:145. Reed RL, Revel AD, Carter AO, Saadi HF, Dunn EV. A controlled before-after trial of structured diabetes care in primary health centres in a newly developed country. Int J Qual Health Care 2005;17(4):281-6. Quelques rfrences mthodologiques Eccles M, Grimshaw J, Campbell M, Ramsay C. Research designs for studies evaluating the effectiveness of change and improvement strategies. Qual Saf Health Care 2003;12(1):47-52. Fergusson D, Hebert P, Shapiro S. The before/after study design in transfusion medicine : methodologic considerations. Transfus Med Rev 2002;16(4):296-303. Shadish WR, Cook TD, Campbell DT. Experimental and quasi-experimental designs for generalized causal inference. Boston:Houghton Mifflin Company, 2002.
HAS/Service des recommandations professionnelles/Juin 2007 21
Les critres de jugement dfinis pour chaque type d'tude ne doivent pas tre des critres visant valuer l'accord des mdecins, avec les recommandations ou les connaissances des mdecins ou mme des pratiques dclares par les mdecins (2). Les critres de jugement sont destins mesurer l'impact, positif et ngatif, d'une intervention, en termes de modification relle des pratiques des mdecins, et non de modifications de leurs connaissances ou de leurs pratiques dclares. Cependant, l'utilisation de case-vignettes sous des formes diverses (papier ou informatique) a t propose et utilise depuis de nombreuses annes. Ces cas-papiers ou lectroniques sont des brves histoires d'un malade fictif bas sur une situation clinique raliste, et accompagn par une ou plusieurs questions qui explorent ce qu'un mdecin ferait si un tel malade se prsentait. Cette mthode a t valide par comparaison d'autres mthodes d'valuation de la qualit des soins : malades simuls (standardized patients) et audit de dossiers. Cette mthode ne semble pas, ce jour, avoir t utilise dans le cadre dtudes dintervention, mais elle pourrait ltre, en particulier dans les situations o des diffrences de recrutement entre hpitaux ou structure de soins constituent un problme. En effet, elle permet d'avoir des rponses attribuables au seul mdecin, et indpendantes de la variabilit lie au recrutement (20-24). 3.2.2 valuer les procdures ou les rsultats
Les critres habituellement utiliss sont des critres valuant les procdures, plutt que des critres valuant les rsultats pour plusieurs raisons. La premire est que l'objectif de l'intervention est d'amliorer les pratiques professionnelles en faisant appliquer des recommandations de pratique clinique, il semble donc logique d'utiliser des critres valuant
HAS/Service des recommandations professionnelles/Juin 2007 22
ces pratiques professionnelles. Ainsi, si une recommandation indique qu'il faut raliser une coloscopie tous les deux ans sur une population risque, le critre de jugement sera le pourcentage de patients ayant une coloscopie selon la recommandation. La seconde est que les recommandations sont bases sur des rsultats dtudes publies, et frquemment sur les rsultats des essais randomiss qui constituent le meilleur niveau de preuve. Si les essais thrapeutiques dmontrent par exemple qu'il est utile de prescrire de l'aspirine en prvention secondaire aprs un infarctus du myocarde, il est inutile, si l'on veut valuer l'impact de recommandations visant amliorer la qualit de la prescription aprs infarctus du myocarde, de vouloir utiliser un critre de jugement de type rsultat (par exemple la mortalit aprs infarctus du myocarde). C'est inutile, car c'est l'objet des essais randomiss ayant conduit la recommandation, et non d'un essai ayant pour objet d'valuer l'impact de la mise en uvre de recommandations ou pour objet de dmontrer l'impact sur la mortalit d'une telle prescription. Une telle ambition serait en effet irraliste, car s'il faut des milliers ou des dizaines de milliers de malades pour dmontrer, dans le cadre d'un essai thrapeutique, l'intrt de l'aspirine, il faudra un nombre infiniment suprieur de malades pour dmontrer l'impact d'une intervention qui va permettre d'augmenter de 60 80 % le pourcentage de malades qui recevront rellement de l'aspirine aprs un infarctus du myocarde. Mant et Hicks (25) ont montr que pour mettre en vidence une rduction relative de mortalit de 3 % entre deux hpitaux, il tait ncessaire d'inclure 32 846 malades par hpital, pour un critre de jugement de type rsultat (mortalit), et 155 si l'on utilise un autre critre de jugement de type procdure de soins (Estce que les malades devant recevoir de l'aspirine ou des btabloquants recevaient bien ces traitements ?).
3.3 Aveugle
Les critres de jugement ou indicateurs retenus doivent idalement tre recueillis l'insu de l'intervention ralise, afin d'viter un biais de performance. Ce type de biais n'existe pas, bien videmment si les donnes utilises sont recueillies de manire systmatique, indpendamment de l'tude. A contrario si ces donnes sont recueillies spcifiquement pour une tude, il est logique de prvoir un valuateur (outcome assessor) identique pour les diffrents bras ou diffrents sites, n'ayant pas t impliqu dans la ralisation des interventions, et idalement n'ayant pas connaissance de l'intervention effectue lorsqu'il ralise cette valuation (cette condition nest par exemple pas respecte dans la rfrence 16 cite plus haut).
L'utilisation de donnes recueillies de manire systmatique, indpendante de l'intervention est une autre option. Dans de nombreux domaines, prescription des examens complmentaires ou prescription des mdicaments, il existe de multiples systmes d'informations, par exemple l'hpital, mais galement en mdecine de ville (donnes de lAssurance maladie). Bien videmment, les informations disponibles l'aide de ces systmes d'informations sont souvent incompltes, et parfois inexactes (par exemple pour le diagnostic des malades) (26), car ces systmes d'informations n'ont pas t conus dans cet objectif. Nanmoins, les sources d'informations ont l'avantage majeur d'exister (parfois depuis plusieurs annes), et de ne pas ncessiter de moyens supplmentaires pour le recueil des donnes.
Nous distinguerons trois priodes chronologiques distinctes, avant, pendant et aprs la ralisation de ltude.
La mthode PICOT (Population Intervention Comparison Outcomes Time) peut aider la mise en place de ces diffrentes tapes. P Population Trois niveaux de population peuvent tre dfinis : (P1) Patients = patients concerns par l'intervention (par exemple, des patients atteints de diabte de type 2) (P2) Professionnels = professionnels de sant viss par l'intervention (par exemple, des mdecins gnralistes) (P3) Services mdicaux = groupes de professionnels viss par l'intervention (par exemple, cabinets de mdecine gnrale) ou l'environnement dans lequel les professionnels concerns travaillent si l'intervention vise des individus plutt que des groupes de professionnels. (par exemple, cabinets de mdecine gnrale en zone rurale) I Intervention Quelle intervention valuer ? (par exemple, intervention faisant appel la formation mdicale continue) C Comparaison Quelle intervention utiliser pour la comparaison ? (intervention alternative ou absence d'intervention) (par exemple, formation interne habituelle) O Outcome ou Rsultats Comment l'effet de l'intervention sera-t-il mesur ? (par exemple, taux de respect dune recommandation, pourcentage de patients diabtiques ayant eu un dosage dhmoglobine glyque dans les derniers six mois T Temps Combien de temps attendre aprs larrt de lintervention avant d'valuer les rsultats ? (par exemple, un an aprs la fin de l'intervention)
1.1.2
La justification de la recherche
La Dclaration d'Helsinki stipule que la recherche biomdicale, impliquant des humains doit tre fonde sur une connaissance approfondie de la littrature scientifique c'est--dire que le fait d'exposer inutilement des tres humains aux risques de la recherche est contraire l'thique. Certaines tudes cliniques se sont avres inutiles, parce que la rponse la question pose aurait t (ou aurait pu tre) obtenue par le biais d'une revue systmatique de la littrature existante. Il est souhaitable que la justification de l'tude dcrive les raisons pour lesquelles la question pose est importante. La justification doit inclure les bienfaits perceptibles de toute intervention devant tre value. Elle doit indiquer la manire dont l'intervention tudie pourrait fonctionner, notamment si les donnes antrieures concernant ce type d'intervention sont peu nombreuses, voire inexistantes. Protocole : Dcrire la raison pour laquelle la question de recherche mrite d'tre tudie. Dcrire comment l'intervention value pourrait fonctionner. Prciser comment les rsultats pourraient faire progresser les connaissances thoriques et pratiques, dans le domaine concern.
1.1.3
Existence de recommandations
Si lintervention concerne la mise en uvre de recommandations destines amliorer la pratique clinique, il est important dutiliser un rfrentiel valide, et qui sera accept par les utilisateurs. Ce rfrentiel doit tre issu de recommandations labores, selon un processus rigoureux. Il existe aujourdhui suffisamment de recommandations nationales publies pour ne pas avoir laborer des recommandations locales. En France, ces recommandations sont disponibles sur le site de la HAS ou pour la cancrologie sur le site de la Fdration nationale des centres de lutte contre le cancer (www.fnclcc.fr). On peut aussi prendre en compte une recommandation publie par un organisme tranger comme le National Institute for Health and Clinical Excellence (NICE) au Royaume-Uni (www.nice.org.uk) ou une recommandation rfrence par la National Guideline Clearinghouse (NGC) de lAgency for Healthcare Research and Quality (AHRQ) aux tats-Unis (www.guideline.gov). Il faut cependant dans tous les cas sassurer de la qualit mthodologique de la recommandation, et prendre garde ce que son contenu ne soit pas en contradiction avec la rglementation en vigueur en France (en particulier avec les donnes de lAutorisation de mise sur le march en ce qui concerne les mdicaments). La qualit dune recommandation peut tre value au moyen dune grille de lecture comme celle propose par le groupe AGREE (Appraisal of Guidelines Research and Evaluation) (www.agreecollaboration.org), qui a fait lobjet dune traduction en franais. Il est en particulier essentiel de sassurer que lon pourra extraire de la recommandation des critres ou indicateurs dvaluation simples. Si une situation clinique dintrt na pas fait lobjet de recommandations rcentes ou si les pratiques idales sont discutes, il faut envisager de changer de thme de travail. 1.1.4 Formulation de la question et des objectifs de recherche
Le but d'une tude dintervention est d'valuer si (et quel degr) une ou plusieurs interventions mises en uvre au niveau d'une population donnent ou non des rsultats diffrents (ex. : sant, processus de soins de sant, conomie, satisfaction des patients) par rapport une ou plusieurs autres interventions ou labsence dintervention. Il est souhaitable que le but de l'tude dcrive, en une ou deux phrases, la finalit de l'tude propose.
HAS/Service des recommandations professionnelles/Juin 2007 27
Les objectifs sont les questions spcifiques pour lesquelles l'tude est destine. Il y a gnralement une question principale et ventuellement plusieurs questions secondaires.
Protocole : noncer la question de recherche. Spcifier les hypothses explorer et les objectifs de recherche. Sassurer que la question inclut : la population, l'intervention exprimentale, l'intervention de comparaison, les rsultats cls et le Temps = PICOT tablir une liste claire et concise numrant les objectifs principaux et secondaires, ainsi que les hypothses que l'tude va examiner. Ceux-ci doivent tre traits en termes de rsultats mesurables.
1.1.5
La mesure de la performance de base est indispensable la planification et l'valuation dune intervention, car elle aide : justifier lintervention en dmontrant l'existence d'un cart entre la pratique clinique relle et la pratique clinique souhaite ; prciser quelle sera la population-cible de ltude valuer lampleur du problme. Une faible performance de base indique une importante marge potentielle damlioration, tandis quune performance de base leve indique une petite marge pour l'amlioration (effet plafond) ; identifier les modes de pratique et les facteurs qui les dterminent. On peut alors utiliser ces facteurs pour adapter lintervention ; utiliser les mesures comme partie intgrante dune intervention impliquant un retour dinformations ; calculer la taille de lchantillon. Les moyens tant limits, il est important de ne pas mettre en place une intervention destine amliorer des pratiques dj satisfaisantes. Lanalyse des pratiques peut tre ralise de diffrentes manires : analyse rtrospective de dossiers mdicaux, analyse dindicateurs issus du systme dinformations, recueil prospectif de donnes sur une priode limite, voire sil nest pas possible de faire autrement, enqutes auprs de professionnels de sant sur leurs pratiques dclares ou sur leurs connaissances concernant une pratique donne. Les pratiques dclares ne sont pas un bon reflet des pratiques relles (2,27). Lanalyse des dossiers dans le cadre dun audit clinique a fait lobjet de plusieurs documents mthodologiques disponibles sur le site de la HAS. Rappelons simplement que lintrt de cette mthode est limit par le temps ncessaire la recherche et lanalyse du contenu des dossiers mdicaux ainsi que la qualit des informations retrouves dans les dossiers. Recueillir des donnes de faon prospective, que lon recherche des informations sur les pratiques relles, dclares ou les connaissances, permet de sassurer de la qualit du recueil des informations, mais demande galement du temps et des moyens humains. Lanalyse des indicateurs issus du systme dinformations est limite par le type dinformations que lon peut obtenir (essentiellement des donnes de prescription dactes ou de mdicaments), et par laccs un systme adquat dinformations. Cette approche doit tre privilgie chaque fois que possible. Elle est plus simple mettre en uvre en milieu hospitalier. En mdecine ambulatoire, elle demande laccs aux systmes dinformations de lAssurance maladie.
Lanalyse des pratiques implique, ds ce stade, de se demander quels sont les critres de jugement de la qualit des pratiques lon souhaite mesurer. Ces critres peuvent toucher aux structures, aux procdures ou aux rsultats. Pour des raisons dveloppes plus loin, les critres de procdures sont les plus frquemment utiliss. Par exemple, si lon souhaite valuer la prise en charge du diabte de type 2, lanalyse de la base de donnes de lAssurance maladie, o sont enregistres toutes les prestations rembourses aux assurs sociaux, permet destimer le pourcentage de patients chez qui une recherche dhmoglobine glyque a t ralise dans les 6 derniers mois (17). Un recueil prospectif spcifique permet de recueillir non seulement le nombre dexamens raliss, mais aussi leur rsultat, ainsi quun certain nombre dinformations impossibles recueillir par lanalyse des bases de donnes de lAssurance maladie (ralisation dun fonds dil, mesure de la pression artrielle, etc.) (28). Ces dernires informations auraient probablement pu aussi tre recueillies de faon rtrospective par lanalyse de dossiers mdicaux, mais la qualit des informations obtenues aurait certainement t bien infrieure.
La population tudie n'est pas le groupe d'individus ou de grappes inclus dans ltude ( savoir : l'chantillon), mais plutt le groupe auquel lon souhaite gnraliser les rsultats de ltude. Il faut d'abord dcider et dfinir la population, puis laborer un plan pour obtenir un chantillon reprsentatif de cette population. La mthode PICOT prsente plus haut peut aider la dfinition de la population. Il faut galement dfinir l'environnement et le lieu de ltude, car ils influeront sur la validit externe des rsultats. Les diffrentes institutions de sant varient grandement en termes d'organisation, d'exprience, de ressources et ainsi qu'en termes de risque de rfrence de l'tat pathologique faisant l'objet de l'tude. Le climat et d'autres facteurs physiques, conomiques, gographiques et socioculturels peuvent galement affecter la validit externe d'une tude. En outre, il convient de spcifier clairement si l'tude doit tre effectue dans un ou plusieurs centres. Protocole : Fournir une description de la population de l'tude en termes de patients, professionnels et services mdicaux. Donner la raison pour laquelle ces patients, professionnels et services mdicaux ont t slectionns. Dcrire et expliquez l'environnement et les lieux o l'tude sera effectue. Indiquer si l'tude a eu lieu dans un ou plusieurs centres (tudes multicentrique).
1.2.2
Il est gnralement ncessaire de restreindre la population tudie au moyen de critres d'inclusion. Il existe trois niveaux de participants dans une tude dintervention en grappes : patients, professionnels et services. Il doit y avoir des critres explicites d'inclusion pour chacun d'entre eux. En ce qui concerne les patients, les critres d'inclusion sont gnralement lis leur maladie ou leur tat (par exemple : fibrillation auriculaire, femmes en phase d'accouchement). Des critres supplmentaires peuvent inclure des facteurs sociodmographiques (ge, sexe, etc.), un facteur de comorbidit (ex : diabte) ou un type d'intervention reue (ex : examen, intervention chirurgicale, traitement mdicamenteux) ; les critres de non-inclusion sont souvent utiliss pour garantir la scurit des patients.
HAS/Service des recommandations professionnelles/Juin 2007 29
En ce qui concerne les professionnels de sant, les critres d'inclusion peuvent inclure la profession (infirmire, mdecin), la spcialit clinique (infirmire en traumatologie, cardiologue), le nombre minimum de patients pris en charge, l'anciennet (tudiant, praticien diplm), etc. En ce qui concerne les services mdicaux, les critres d'inclusion peuvent inclure le niveau des soins prodigus (secondaires, tertiaires), le nombre minimum de cas pris en charge, etc. Une description prcise de ces critres, y compris les critres dmographiques de la population tudie, est ncessaire pour permettre aux lecteurs d'valuer la validit externe (l'aptitude la gnralisation) des rsultats de l'tude. Protocole : tablir des listes spares de critres d'inclusion pour les patients, les professionnels et les services mdicaux. tablir des listes spares de critres d'inclusion et de non-inclusion.
Le faible impact des recommandations nest pas uniquement li la mthodologie de leur mise en uvre, mais galement par lexistence de facteurs particuliers, qui constituent des freins ou barrires leur mise en uvre. Il peut donc tre utile destimer leur existence et leur importance, avant la mise en uvre dune intervention destine amliorer la qualit des soins. Le choix de lintervention peut alors tre choisi spcifiquement, de manire prendre en compte ces barrires ou freins, permettant ainsi un meilleur impact.
HAS/Service des recommandations professionnelles/Juin 2007 30
Les freins lis lapplication des recommandations peuvent tre classs en facteurs lis : aux caractristiques individuelles des professionnels de sant (facteurs cognitifs, comportementaux, motivation) ; lenvironnement humain (patients, interaction mdecin/patient, interaction entre professionnels) ; aux aspects organisationnels (organisation des soins, formation), politiques ou structurels (mode de financement des soins, environnement lgal). Ces freins sont donc susceptibles dintervenir chaque phase de la prise en charge dun malade. Tout professionnel de sant souhaite dlivrer les meilleurs soins possibles son patient. Mais, comme pour tout comportement (par exemple comportement social, physique, sexuel), il ny a pas de lien vident entre connaissance et pratique de soins. Le simple lavage des mains dans la prvention des infections nosocomiales en est une bonne illustration (29). Les professionnels de sant connaissent limportance et la gravit des infections survenant lhpital. Ils savent que le lavage des mains prvient un grand nombre de ces infections. Mais il existe des obstacles individuels (motivation), lis lenvironnement humain (manque de leadership), organisationnels (manque de temps) ou financiers (manque de lavabos ou de dispositifs de dlivrance de solution hydro-alcoolique) qui empchent lamlioration des pratiques. Toute action visant amliorer les pratiques doit donc prendre en compte lensemble de ces obstacles. De nombreux modles ou thories sont proposs pour concevoir une stratgie changement des pratiques mdicales. Ces thories sont issues en particulier du domaine lapprentissage et de la connaissance, de lanalyse du comportement, de la sociologie travail, de lconomie et du management, de la qualit. La description de ces thories et leur utilisation potentielle sort du cadre de ce document. de de du de
Un grand nombre de mthodes issues de la recherche qualitative ont t proposes pour identifier les barrires potentielles au changement : questionnaires, focus groups, entretiens individuels, mthode Delphi, observation. Les barrires (et facilitations) identifies, une stratgie de changement adapte peut tre mise en place. Cependant, les donnes concernant lefficacit de telles interventions manquent. Comment valuer et tenir compte des obstacles au changement reste du domaine de la recherche, et demande lapport de chercheurs en sciences sociales (30-32). 1.4.2 Choix dune intervention adapte
Il est important de dcrire en dtail chaque intervention, y compris l'intervention tmoin . On peut sinspirer de la classification propose par le groupe EPOC (Effective practice and Organization of Care review group), qui liste les diffrents types dinterventions possibles pour modifier le comportement du prescripteur (annexe 2). Mais il existe une trs grande htrognit dans ces interventions, mme si lon ne prend en compte que celles dun mme type (par exemple laudit feedback), et il nest pas possible de faire sur ce point des recommandations prcises. Toute intervention doit tre adapte au contexte local : moyens disponibles, organisation des soins, existence ou non dun systme dinformation, etc. Par exemple, la mise en place de visite domicile (ou outreach visits), telles que les visites confraternelles utilises par lAssurance maladie, demande des moyens, et est plus approprie lorsque lintervention touche de nombreux centres ou prestataires de soins (comme cest le cas en mdecine ambulatoire). Au contraire, les rappels au moment de la dcision, dont lutilisation est favorise par lexistence dun systme informatis de prescription, sont plus adapts lexercice en milieu hospitalier. La meilleure faon pour choisir une intervention est donc de consulter la banque de donnes Cochrane (www.cochrane.org). Cette banque contient de nombreuses revues systmatiques qui traitent soit dune intervention spcifique (par exemple laudit feedback), soit dun problme de sant spcifique (par exemple les interventions destines amliorer la prise en charge du
HAS/Service des recommandations professionnelles/Juin 2007 31
diabte (33)). On peut aussi saider du rapport publi en 2000 par lANAES, disponible sur le site de la HAS (2). Enfin, il est souvent utile dextraire des revues systmatiques quelques articles cls, afin de voir comment les interventions sont prcisment mises en uvre. La description dtaille de l'intervention doit comprendre (34) : le type de la stratgie d'intervention (classification Cochrane), le groupe et les participants cibles ; le ou les responsables de la mise en uvre /intervenant(s) (experts, professionnels de sant, leaders dopinion, etc.) ; la frquence, le moment et la dure de lintervention ; la description du type dinformation fournie. Par exemple, pour dcrire le responsable de la mise en uvre d'une intervention pdagogique, il est ncessaire de prciser le nombre, la formation et le niveau de comptence des personnes charges de la formation. Cette description sera bien-sr trs utile lvaluation de la validit externe des rsultats de ltude. Protocole : Dcrire en dtail l'intervention ou les interventions qui seront effectues. Dcrire le droulement de lintervention. Dcrire en dtail qui se chargera d'effectuer la ou les interventions. Dcrire en dtail les soins courants qui seront prodigus.
Essais randomiss randomisation collective tudes contrles avant et aprs (en grappes) Modles srie temporelle Afin de recueillir des informations gnralisables sur la valeur dune intervention exprimentale, on doit tre capable d'attribuer avec certitude les effets observs de lexprimentation cette intervention. Par consquent, il est ncessaire de choisir une tude qui minimise les biais ventuels (tendance systmatique de tout facteur qui fausse linterprtation des rsultats, et compromet les conclusions tires de ltude). Les essais cliniques randomiss par grappes sont considrs comme la conception idale pour valuer les interventions damlioration de la qualit (cf. chapitre prcdent). Cependant, dans les essais cliniques randomiss par grappes dans lesquels relativement peu de grappes (ex. : hpitaux) sont disponibles pour la randomisation, il existe un risque de dsquilibre accru dans les rsultats observs, dans le groupe exprimental et le groupetmoin d au jeu du hasard. On peut aussi vouloir raliser une tude dans sa propre structure rendant trs difficile la randomisation. Dans tous les cas, si lon souhaite rellement valuer limpact dune intervention, il faut tout pris viter la ralisation dune tude avant/aprs, mais envisager une srie chronologique ou une tude avant/aprs avec groupe-tmoin (par exemple un service
HAS/Service des recommandations professionnelles/Juin 2007 32
dans lequel on ne met pas en place lintervention). Dans ce dernier cas, on doit tre attentif au risque de contamination entre les groupes. Les sries chronologiques (ou temporelles) sont particulirement appropries lorsque lon dispose de bases de donnes permettant de voir lvolution dun indicateur sur une longue priode (par exemple bases de donnes hospitalires ou de lAssurance maladie). Ltude avant/aprs ne permet que de montrer que la qualit des soins samliore, sans pouvoir dterminer quelle en est la raison. Que ltude soit randomise ou non, il existe des critres de qualit que lon doit respecter (cf. annexe 3) Protocole : Utiliser si possible un modle randomis. Utiliser un modle srie temporelle si une conception randomise n'est pas possible. Faire attention de ne pas tirer des conclusions sur le rsultat dune tude avant/aprs.
Il est videmment plus facile recueillir que le taux de mortalit par rcidive dinfarctus du myocarde (36). 1.6.2 Comment tablir un indicateur de procdure ?
Les indicateurs de procdures doivent tre issus de recommandations professionnelles valides. La mthodologie de construction dun indicateur, critre de jugement de limpact dune intervention, a t dcrite dans un document disponible sur le site Internet de la HAS (35). Protocole : tablir une liste des indicateurs qui seront utiliss, et justifier leur utilisation. Identifier le critre de jugement principal. Indiquer clairement si la mesure du critre de jugement est objective. En cas dutilisation dun instrument de mesure, prciser sil a t valid. Inclure les dfinitions pour les rsultats, dont l'interprtation est susceptible de varier, par exemple : dfinition de hypertension. Dans les annexes, insrer une copie de tous les questionnaires et autres instruments de mesure.
1.6.3
On doit absolument dterminer le moment o il faudra les mesurer. En gnral, la priode de suivi doit tre suffisamment longue pour permettre d'observer une grande varit d'effets (autres que ceux qui sont immdiatement observs ds le dbut de l'intervention). On doit galement inclure les mesures de base, et dcider si les effets d'apprentissage et de perte des acquis doivent tre valus. Le moment de chaque mesure de rsultat doit tre rendu explicite. 1.6.4 Mesures de base
Les mesures de base incluent les caractristiques dmographiques de la population de l'tude, ainsi que les mesures de base de la performance. Les interventions visant modifier le comportement professionnel n'ont pas un effet immdiat et durable. Au contraire, leur effet est progressif (effet d'apprentissage), mais il dcline avec le temps (effet de perte des acquis). Pour saisir et quantifier ces effets, il est important de mesurer les rsultats par sries au fil du temps. Nanmoins, une telle dcision dpend de l'quilibre entre les avantages et les cots, en termes de ressources et de complexit de l'tude. Protocole : Spcifier la dure de la priode de suivi. Indiquez le moment o chaque rsultat doit tre mesur (en incluant le calendrier pour toute mesure rpte).
1.6.5
La prise en compte des aspects statistiques impose la collaboration dun mthodologiste ou statisticien connaissant les tudes en grappe.
La taille de lchantillon retenue pour une tude doit tre suffisante pour permettre de dtecter une diffrence importante au point de vue clinique, sur le critre de jugement principal avec une probabilit souhaite. Le calcul de la taille d'chantillon signifie l'quilibrage de la prcision requise dans l'estimation de cette diffrence, et la minimisation de la taille d'chantillon requise pour obtenir cette prcision. Le calcul dpend de la manire dont l'tude a t conue, du type de donnes des rsultats primaires (binaires c/continues) et du niveau de signification souhait, etc. Pour les essais en grappes, il faut tenir compte de l'effet de regroupement. Il faut galement voir large, afin de tenir compte des dsistements. Il y a un choix faire entre les difficults logistiques et les cots associs au recrutement de nouvelles grappes, et les difficults associes l'augmentation du nombre de patients par grappe. Protocole : Calculer la taille de l'chantillon, en se fondant sur le critre de jugement principal. Ce calcul doit normalement reflter le type de rsultat (ex. : binaire, continu). Estimer les rsultats prvus dans les groupes-intervention et tmoins. Indiquer le niveau (alpha) de signification, souvent estim 5 %. Indiquer le niveau (bta) d'efficacit, souvent estim 80 %. Estimer le Coefficient de corrlation intraclasse (CCI). Estimer la taille moyenne d'une grappe. Augmenter la taille de l'chantillon en prvision de l'effet de mise en grappes. Augmenter la taille de l'chantillon en prvision des dsistements potentiels. Donner la taille rsultante de l'chantillon par groupe de comparaison. 1.6.6 Programmation de lanalyse statistique des rsultats
Les mthodes statistiques standards, utilises pour analyser les tudes randomises sur des patients, se fondent sur un principe de base selon lequel le rsultat obtenu pour un patient est compltement distinct de celui obtenu pour un autre patient. On dit qu'ils sont indpendants . Toutefois, ce principe ne s'applique pas aux tudes en grappes, car les patients au sein d'une mme grappe vont vraisemblablement rpondre de manire similaire. Dans le chapitre protocole, la section traitant de l'analyse statistique doit fournir des dtails prcis sur la manire dont leffet grappe sera prise en compte. Il faut galement faire bien attention pour viter ce que l'on appelle l'erreur d'unit d'analyse. Cette erreur rsulte de l'usage inappropri des mesures du niveau patients , comme unit d'analyse servant formuler des conclusions propos d'un niveau suprieur, comme le niveau professionnels de sant ou les rsultats combins de l'interaction des patients et des professionnels. Son effet habituel est un accroissement erron de l'efficacit d'une exprience, visant dtecter les diffrences entre les groupes intervention et contrle (37-39). Lanalyse statistique des sries chronologiques fait appel des mthodes statistiques particulires (www.epoc.cochrane.org). Protocole : Fournir les rfrences pour toute technique statistique danalyse. Donner des dtails au sujet de l'analyse propose pour les rsultats primaires et secondaires. Spcifier toute analyse de sous-groupes. Fournir des informations sur le traitement des problmes prvus, tels que les donnes manquantes. Surtout, faire participer un statisticien l'laboration de cette section.
HAS/Service des recommandations professionnelles/Juin 2007 35
2.3.2 Gestion des donnes Les tudes doivent, autant que possible, utiliser un systme informatis pour la gestion des donnes. Les systmes informatiques sont utiles pour suivre l'volution du flux de participants et de grappes durant les tudes (par exemple pour le recrutement, les dsistements, les raisons des dsistements, la collecte de donnes et l'enregistrement du flux d'informations entre vous et les participants ou les grappes, comme l'envoi et le retour de questionnaires). Ces systmes permettent aussi une validation rapide et efficace des donnes, ainsi qu'un contrle de la qualit. Protocole : Dcrire les procdures qui seront incorpores dans le systme de gestion des donnes (par exemple, enregistrement de l'envoi/retour de questionnaires). Indiquer les noms des logiciels de saisie et de gestion, ainsi que des langages de programmation qui seront utiliss pour l'tude. Dtailler la configuration informatique minimale, ncessaire pour la gestion et la transmission de donnes.
2.3.3 Saisie des donnes La saisie des donnes est le processus de conversion des informations, quelle qu'en soit la source originale, sous forme de donnes sur support lectronique pouvant tre gres et
HAS/Service des recommandations professionnelles/Juin 2007 38
analyses au moyen d'un ordinateur. La mthode la plus courante de saisie de donnes est la transcription d'informations contenues sur un formulaire papier, sur un fichier informatique. La saisie des donnes peut tre effectue par une seule personne (saisie simple) ou deux fois par des personnes diffrentes (saisie double). Le logiciel servant stocker et grer les donnes est appel systme de gestion de base de donnes. Rcemment, la technologie moderne a permis de remplacer la phase de saisie manuelle par des systmes de capture de donnes . Grce cette mthode, les donnes sont soit scannes par voie lectronique, soit saisies directement dans un ordinateur, par exemple au moyen d'un ordinateur de poche (PDA) ou via Internet. Protocole : Dcrire succinctement la manire dont les donnes seront saisies dans le systme de gestion des donnes. Dcider si cette tche sera effectue uniquement par le centre de coordination des donnes, et prciser si les donnes seront saisies manuellement (saisie simple ou double) ou bien scannes.
2.3.4 Contrle de qualit Le succs de toute tude clinique dpend de la qualit des donnes collectes. Pour garantir l'obtention de donnes de bonne qualit, il est ncessaire d'laborer des procdures d'assurance qualit compltes et dtailles, telles que celles labores pour le contrle des centres cliniques et celles servant assurer la qualit du traitement des donnes au centre de coordination. De mme que pour tous les aspects des tudes cliniques, un programme de contrle-qualit ncessite un souci du dtail et une planification minutieuse. Ce programme doit inclure un plan de vrification des donnes (Quelle quantit sera vrifie et par qui ? selon quelle mthode ?), des listes de contrle (registre dtaill montrant quelles donnes ont t modifies, la raison de la modification, qui l'a effectue et quand ?), et des procdures de vrification des sources (Quelle quantit de donnes seront compares au document source ?). Protocole : Dcrire les mesures permettant de garantir que la manipulation ou la transmission des donnes n'entrane pas de modifications involontaires. Ces mesures doivent inclure : la vrification des donnes, les listes de contrle et les procdures de vrification des donnes source.
Rfrences
1. Grimshaw G, Thomas RE, MacLennan G, Fraser C, Ramsay CR, Vale L, et al. Effectiveness and efficiency of guidelines dissemination and implementation strategies. Health Technol Assess 2004;8(6). 2. Agence nationale d'accrditation et d'valuation en sant. Efficacit des mthodes de mise en uvre des recommandations mdicales. Paris: ANAES; 2000. 3. Durand-Zaleski I, Colin C, Blum-Boisgard C. An attempt to save money by using mandatory practice guidelines in France. BMJ 1997;315(7113):943-6. 4. Durieux P, Chaix-Couturier C, Durand-Zaleski I, Ravaud P. From clinical recommendations to mandatory practice. The introduction of regulatory practice guidelines in the French healthcare system. Int J Technol Assess Health Care 2000;16(4):96975. 5. Eccles M, Grimshaw J, Campbell M, Ramsay C. Research designs for studies evaluating the effectiveness of change and improvement strategies. Qual Saf Health Care 2003;12(1):47-52. 6. Kosecoff J, Kanouse DE, Rogers WH, McCloskey L, Winslow CM, Brook RH. Effects of the National Institute of Health Consensus Development Program on physician practice. JAMA 1987;258(19):2708-13. 7. Kucher N, Koo S, Quiroz R, Cooper JM, Paterno MD, Soukonnikov B, et al. Electronic alerts to prevent venous thromboembolism among hospitalized patients. N Engl J Med 2005;352(10):969-77. 8. Diwan VK, Eriksson B, Sterky G, Tomson G. Randomization by group in studying the effect of drug information in primary care. Int J Epidemiol 1992;21(1):124-30. 9. Donner A, Birkett N, Buck C. Randomization by cluster. Sample size requirements and analysis. Am J Epidemiol 1981;114(6):906-14. 10. Campbell MK, Fayers PM, Grimshaw JM. Determinants of the intracluster correlation coefficient in cluster randomized trials: the case of implementation research. Clin Trials 2005;2(2):99107. 11. Eldridge SM, Ashby D, Feder GS, Rudnicka AR, Ukoumunne OC. Lessons for cluster randomized trials in the twenty-first century: a systematic review of trials in primary care. Clin Trials 2004;1(1):80-90. 12. Guittet L, Giraudeau B, Ravaud P. A priori postulated and real power in cluster randomized trials: mind the gap. BMC Med Res Methodol 2005;5:25. 13. Auleley GR, Ravaud P, Giraudeau B, Kerboull L, Nizard R, Massin P, et al. Implementation of the Ottawa ankle rules in France. A multicenter randomized controlled trial. JAMA 1997;277(24):1935-9. 14. Horbar JD, Carpenter JH, Buzas J, Soll RF, Suresh G, Bracken MB, et al. Collaborative quality improvement to promote evidence based surfactant for preterm infants: a cluster randomised trial. BMJ 2004;329(7473):1004. 15. Thomas RE, Croal BL, Ramsay C, Eccles M, Grimshaw J. Effect of enhanced feedback and brief educational reminder messages on laboratory test requesting in primary care: a cluster randomised trial. Lancet 2006;367(9527):1990-6. 16. Eccles M, McColl E, Steen N, Rousseau N, Grimshaw J, Parkin D, et al. Effect of computerised evidence based guidelines on management of asthma and angina in adults in primary care: cluster randomised controlled trial. BMJ 2002;325(7370):941. 17. Ricordeau P, Durieux P, Weill A, Chatellier G, Vallier N, Bissery A, et al. Effect of a nationwide program of educational outreach visits to improve the processes of care for patients with type 2 diabetes. Int J Technol Assess Health Care 2003;19(4):70510. 18. Durieux P, Nizard R, Ravaud P, Mounier N, Lepage E. A clinical decision support system for prevention of venous thromboembolism: effect on physician behavior. JAMA 2000;283(21):2816-21. 19. Ray-Coquard I, Philip T, de Laroche G, Froger X, Suchaud JP, Voloch A, et al. A controlled "beforeafter" study: impact of a clinical guidelines programme and regional cancer network organization on medical practice. Br J Cancer 2002;86(3):313-21. 20. Peabody JW, Luck J, Glassman P, Dresselhaus TR, Lee M. Comparison of vignettes, standardized patients, and chart abstraction: a prospective validation study of 3 methods for measuring quality. JAMA 2000;283(13):1715-22. 21. Peabody JW, Luck J, Glassman P, Jain S, Hansen J, Spell M, et al. Measuring the quality of physician practice by using clinical vignettes: a prospective validation study. Ann Intern Med 2004;141(10):771-80. 22. Luck J, Peabody JW, Lewis BL. An automated scoring algorithm for computerized clinical vignettes: evaluating physician performance against explicit quality criteria. Int J Med Inform 2006;75(10-11):7017. 23. Veloski J, Tai S, Evans AS, Nash DB. Clinical vignette-based surveys: a tool for assessing physician practice variation. Am J Med Qual 2005;20(3):151-7.
24. Norcini J. Back to the future: clinical vignettes and the measurement of physician performance. Ann Intern Med 2004;141(10):813-4. 25. Mant J, Hicks N. Detecting differences in quality of care: the sensitivity of measures of process and outcome in treating acute myocardial infarction. BMJ 1995;311(7008):793-6. 26. Peabody JW, Luck J, Glassman P, Dresselhaus TR, Lee M. Comparison of vignettes, standardized patients, and chart abstraction: a prospective validation study of 3 methods for measuring quality. JAMA 2000;283(13):1715-22. 27. Durieux P, Ravaud P, Porcher R, Fulla Y, Manet C, Chaussade S. Long-term impact of a restrictive laboratory test ordering form on tumor marker prescriptions. Int J Technol Assess Health Care 2003;19(1):106-13. 28. Varroud-Vial M, Simon D, Attali J, Durand-Zaleski I, Bera L, Attali C, et al. Improving glycaemic control of patients with Type 2 diabetes in a primary care setting: a french application of the staged diabetes management programme. Diabet Med 2004;21(6):592-8. 29. Grol R, Wensing M. What drives change? Barriers to and incentives for achieving evidencebased practice. MJA 2004;(180):S57-S60. 30. Saillour-Glenisson F, Michel P. Facteurs individuels et collectifs associs l'application des recommandations de pratique clinique par le corps mdical. Revue de littrature. Rev Epidemiol Sant Publ 2003;51:65-80. 31. Cabana MD, Rand CS, Powe NR, Wu AW, Wilson MH, Abboud PA, et al. Why don't physicians follow clinical practice guidelines? A framework for improvement. JAMA 1999;282(15):1458-65. 32. Grol R, Grimshaw J. From best evidence to best practice: effective implementation of change in patients' care. Lancet 2003;362(9391):1225-30. 33. Grimshaw J, McAuley LM, Bero LA, Grilli R, Oxman AD, Ramsay C, et al. Systematic reviews of the effectiveness of quality improvement strategies and programmes. Qual Saf Health Care 2003;12(4):298-303. 34. Hulscher ME, Laurant MG, Grol RP. Process evaluation on quality improvement interventions. Qual Saf Health Care 2003;12(1):40-6. 35. Agence nationale d'accrditation et d'valuation en sant. Construction et utilisation des indicateurs dans le domaine de la sant. Principes Gnraux. Paris: ANAES; 2002. 36. Coordination pour la Mesure de la Performance et lAmlioration de la Qualit Hospitalire. Pratique clinique: prise en charge hospitalire de l'infarctus du myocarde aprs la phase aigu. Synthse des
rsultats. Le Kremlin Bictre: Projet COMPAQH; 2006. 37. Whiting-O'Keefe QE, Henke C, Simborg DW. Choosing the correct unit of analysis in Medical Care experiments. Med Care 1984;22(12):1101-14. 38. Campbell MK, Mollison J, Steen N, Grimshaw JM, Eccles M. Analysis of cluster randomized trials in primary care: a practical approach. Fam Pract 2000;17(2):192-6. 39. Kerry SM, Bland JM. Analysis of a trial randomised in clusters. BMJ 1998;316(7124):54. 40. Edwards SJ, Braunholtz DA, Lilford RJ, Stevens AJ. Ethical issues in the design and conduct of cluster randomised controlled trials. BMJ 1999;318(7195):1407-9. 41. Krleza-Jeric K, Chan AW, Dickersin K, Sim I, Grimshaw J, Gluud C. Principles for international registration of protocol information and results from human trials of health related interventions: Ottawa statement (part 1). BMJ 2005;330(7497):956-8. 42. Moher D, Schulz KF, Altman DG. The CONSORT statement: revised recommendations for improving the quality of reports of parallel group randomized trials. BMC Med Res Methodol 2001;1:2. 43. Campbell MK, Elbourne DR, Altman DG, Consort Group. CONSORT statement: extension to cluster randomised trials. BMJ 2004;328(7441):702-8. 44. Uniform requirements for manuscripts submitted to biomedical journals. International Committee of Medical Journal Editors. Ann Intern Med 1997;126(1):36-47.
comme par exemple, lorsque le rsultat d'un test est anormal et que l'on ne retrouve pas le suivi appropri dans le dossier mdical). Rapport de laboratoire amlior (Rapport de laboratoire conscutif un rsultat anormal et destin des prestataires. Il contient des informations supplmentaires sur des recommandations de suivi spcifique). Soutien administratif (systme de rendez-vous de suivi ou autocollants sur dossiers). Rappels implicites (valeurs prdictives pour des rsultats de tests anormaux sans qu'il y ait une recommandation explicite pour une action). Interventions personnalises : Utilisation d'entretiens personnels, de discussions de groupe ( groupes de rflexion ) ou d'enqutes sur les prestataires, pour identifier les obstacles au changement et l'laboration ultrieure d'une intervention visant lever les obstacles identifis. Revue par les pairs. Stratgies combines : spcifier l'utilisation du classement des interventions ci-dessus, le cas chant. Autre, spcifier. 2. Interventions financires Interventions sur les prestataires : Rmunration l'acte. Capitation (le prestataire peroit un montant fixe par personne dans la population-cible par unit de temps pour fournir des soins spcifiques). Salariat (un prestataire peroit un salaire pour fournir des soins de sant spcifiques). Rmunration au rendement d'un prestataire (un prestataire particulier reoit une rtribution ou un avantage financier direct ou indirect pour l'excution d'une action spcifique). Rmunration au rendement d'une institution (une institution ou des groupes de prestataires reoivent des rtributions ou des avantages financiers directs ou indirects pour l'excution d'une action spcifique). Subvention/indemnit verse un prestataire (un prestataire particulier reoit une rtribution ou un avantage financier direct ou indirect, non li l'excution d'une action spcifique). Subvention/indemnit verse une institution (une institution ou un groupe de prestataires reoivent une rtribution ou un avantage financier direct ou indirect, non li l'excution d'une action spcifique). Pnalit impose un prestataire (une pnalit financire directe ou indirecte est impose un prestataire particulier pour sanctionner une action inapproprie). Pnalit impose une institution (une pnalit financire directe ou indirecte est impose une institution ou des groupes de prestataires pour sanctionner une action inapproprie). Changements dans le formulaire (ajouts ou retraits de produits disponibles remboursables). Autre, spcifier. Interventions sur les patients : Prime. Copaiement. Ticket modrateur. Rmunration des patients. Subvention/indemnit verse aux patients. Pnalit impose aux patients. Autre, spcifier. 3. Interventions organisationnelles Ces interventions peuvent inclure des changements au niveau de l'amnagement matriel des centres de soins de sant, des systmes de gestion des dossiers mdicaux ou de la proprit.
Interventions structurelles : Changements au niveau des locaux/sites de prestation de soins (ex. : dmnagement d'un service d'orthognie prcdemment install dans un hpital vers un tablissement scolaire). Tlmdecine (fourniture de moyens de communication et discussion de cas entre des professionnels de sant loigns). Changements au niveau des systmes de gestion des dossiers mdicaux (ex. : passage des dossiers sur support papier aux dossiers sur support informatique). Autres changements au niveau des systmes de mise jour ou de recherche d'informations (ex. : systme de suivi de patients). Autres changements au niveau de l'amnagement matriel, des installations et des quipements. Changements au niveau de l'tendue et/ou de la nature des services (ex. : mise en place d'un service de chirurgie ambulatoire). Changements au niveau de la prsence et de l'organisation des processus de gestion de la qualit. Changements au niveau de la proprit et/ou de l'affiliation des hpitaux et autres quipements. Autres changements structurels au niveau de l'organisation, personnel non compris (spcifier). Interventions axes sur le personnel de sant : Examen des tches des professionnels de sant (Changements au niveau de l'tendue des tches parmi les professionnels de sant galement appel substitution professionnelle ou empitement sur les limites ; ex. : des infirmires sagesfemmes assurant des soins obsttriques ou des pharmaciens donnant des conseils sur les mdicaments, alors que ces fonctions taient auparavant assures par des infirmires et des mdecins). quipes multidisciplinaires (des professionnels de sant appartenant diffrentes disciplines travaillent ensemble en quipe pour fournir des soins de sant un patient ou une population). Gestion de cas (un professionnel de sant se charge de coordonner les soins fournis un patient par plusieurs prestataires et/ou centres de soins). Autre intgration de services (mcanismes de suivi pour coordonner les soins fournis un patient par franchissement des frontires organisationnelles ou hospitalires , parfois appels soins intgrs ). Interventions au niveau de la comptence collective (modifications portant sur le nombre, le type ou la qualification des membres du personnel). Interventions visant amliorer les conditions de travail et la gratification matrielle/morale des prestataires (ex. : interventions pour remonter le moral ). Autre, spcifier. Interventions axes sur les patients : Interventions facilitant la participation de patients individuels (ex. : outils d'aide la dcision destins aux patients). Interventions facilitant la participation de groupes de patients (ex. : groupes de rflexion, panels de patients). Autre, spcifier. 4. Interventions rglementaires Toute intervention visant modifier la dlivrance ou les cots des services de sant par le biais d'un rglement ou d'une loi. Il est possible qu'il y ait un chevauchement entre ces interventions et des interventions organisationnelles et financires, ou qu'une intervention comporte des lments provenant de plusieurs catgories. volutions de la responsabilit mdicale. Gestion des rclamations des patients. Accrditation. Autorisation d'exercer. Autre, spcifier.
HAS/Service des recommandations professionnelles/Juin 2007 45
La cotation de cette grille est donne titre indicatif. Mais une cotation 0 lune des 7 questions exclut le thme valu.
Diffusion simple de documents dinformation Leaders dopinion Rappels au moment de la dcision Visites domicile Action sur les patients Mass media Consensus locaux Marketing Autre Intervention organisationnelle Oriente vers le professionnel Oriente vers le patient Modifications structurelles Intervention financire Oriente vers le professionnel Oriente vers le patient Oriente vers linstitution Support de lintervention Informatique Papier Oral Oral direct Oral tlphonique Autre
Oui Oui Oui Oui Oui Oui Oui Oui Oui Oui
Non Non Non Non Non Non Non Non Non Non
Quelle est la nature de la rfrence de pratique ventuellement utilise ? Recommandation de pratique clinique Confrence de consensus Consensus formalis dexperts Standard de pratique Rgle de dcision Aucune Cette rfrence de pratique est-elle base sur la preuve scientifique ? Oui Non Pas clair Lieu/Contexte Quel est le type de pratique concerne ? Prvention
HAS/Service des recommandations professionnelles/Juin 2007 48
Diagnostic Demande dexamen Prescription Prise en charge globale dun problme Dossier mdical Organisation des soins Rsultat des soins Dpistage Pronostic Autre Quelles sont les informations sur le contexte dans lequel ltude a t ralise ? Lieu Pays Rgion Ville Type de soins Ambulatoires Hospitaliers Statut acadmique Public Priv Universitaire Inconnu Mode de prise en charge (remboursement) des soins Connu Inconnu quelle date ltude a-t-elle t ralise ? (date du dbut de lintervention) Population Quelles sont les informations sur les professionnels concerns par lintervention ? Profession Mdecin Gnraliste Spcialiste En formation Infirmire Autre Nombre
HAS/Service des recommandations professionnelles/Juin 2007 49
Quelles sont les caractristiques des patients concerns ? Problme clinique ge moyen Nombre total, lors de lintervention Critres de jugement Combien y a-t-il de critres de jugement ? (n < 4, par ex.) Pour chaque critre de jugement : Que concerne ce critre de jugement ? La procdure Mesure du comportement du mdecin Mesure du comportement du patient Les rsultats Morbidit des patients Mortalit des patients Autre Quelle est lunit danalyse correspondante ? Patient Professionnel Cabinet Hpital Institution Population Autre Aspects thiques Un comit dthique a-t-il approuv ltude ? CRITRES DE QUALIT Connat-on le pourcentage de professionnels de sant (ou units dallocation) concerns par ltude rapport au nombre total de professionnels de la populationcible ? Oui Non Pas clair Oui Non
Quelle est lunit dallocation des groupes ? (unit de randomisation) Patient Professionnel Cabinet Hpital Institution Population
HAS/Service des recommandations professionnelles/Juin 2007 50
Autre Aucune Quelles sont les units danalyse ? Patient Professionnel Cabinet Hpital Institution Population Autre Critres de qualit du schma exprimental Si essai contrl randomis : Dissimulation de la randomisation (ECR) (insu/laveugle/allocation concealment) Notez OUI si Lunit de randomisation est linstitution, le groupe de professionnels, le professionnel et la procdure de randomisation est explicitement dcrite, par exemple table de nombres aux hasard ; lunit de randomisation est le patient ou lpisode de soins, et il existe une forme de randomisation centralise ou sur site informatise ou par enveloppes scelles opaques. Notez PAS CLAIR si Lunit de randomisation nest pas dcrite explicitement ; lunit de randomisation est le patient ou lpisode de soins et les auteurs dcrivent avoir utilis une liste, une table de randomisation, des enveloppes ou enveloppes scelles. Notez NON si Les auteurs dclarent avoir utilise une forme dallocation alterne comme le numro de dossier, la date de naissance, le jour dinclusion ( controlled clinical trial dans la classification EPOC) ; lunit de randomisation est le patient ou lpisode de soins et le processus dallocation est totalement transparent ; Le processus dallocation de sujets a t modifi, par les investigateurs, les professionnels de sant, les patients. Si tude avant/aprs avec groupe-tmoin : Le recueil de donnes dans les groupes dtude est contemporain Les groupes sont comparables Si srie chronologique : Le dbut de lintervention est clairement dfini Oui Non Pas clair Oui Oui Non Non Pas clair Pas clair Oui Non Pas clair Oui Oui Oui Oui Oui Oui Oui Non Non Non Non Non Non Non
Protection contre un changement sculaire (non li lintervention) Lintervention est indpendante dautres changements Il y a suffisamment de points de mesure pour une analyse statistique Il y a un test statistique de tendance (analyse de rupture de pente) Notez OUI si Il existe au moins 20 points de mesure avant intervention, et les auteurs ont ralis une analyse classique type modle ARIMA Il existe au moins 3 points de mesure avant et aprs intervention, et les auteurs ont ralis une analyse de mesures rptes Il existe au moins 3 points de mesure avant et aprs intervention, et les auteurs ont ralis une analyse ANOVA or multiple t-tests , et il existe au moins 30 observations par point Notez PAS CLAIR si Le nombre de points nest pas clairement spcifi dans le texte ou sur les tableaux ou figures (sera not NON si cette information ne peut tre obtenue des auteurs Notez NON si Aucune des conditions prcdentes nest rencontre lintervention na pas affect le recueil de donnes Oui Pour toutes les tudes : > 80 % des professionnels suivis > 80 % des patients suivis Critre(s) de jugement valu(s) en aveugle ou critre(s) de jugement objectif(s) Critre(s) de jugement sr (90 % dagrment entre deux lecteurs ou kappa > 0,8) ou critre(s) de jugement objectif(s) Mesure des pratiques avant intervention et il nexiste pas de diffrence entre groupes Protection contre une contamination entre groupes Oui Oui Non Non Pas clair Pas clair Oui Non Pas clair Oui Non Pas clair Oui Oui Non Non Pas clair Pas clair Non Pas clair Oui Non Pas clair
Notez OUI si allocation par institution, groupe de mdecins, et sil est trs peu probable que le groupe-tmoin ait reu lintervention Notez PAS CLAIR si les professionnels ont t randomiss lintrieur dune structure ou dun groupe de professionnels, et quil est possible quil y ait eu communication entre groupe exprimentale et groupe-tmoins. Notez NON sil est probable que le groupe-tmoin ait reu lintervention (par exemple, si tude en cross over ou si randomisation par patients) RSULTATS Quels sont les principaux rsultats ? Quels sont les principaux rsultats ?
HAS/Service des recommandations professionnelles/Juin 2007 52
Indicateur de rsultat dans chaque groupe (tmoin et intervention), +/- IC (RR) Indicateur de comparaison relative, +/- IC (RRR) Indicateur de comparaison absolue, +/- IC (RAR) A-t-on compar la diffrence pr/postintervention dans les diffrents groupes soumis ltude ? Oui Non Quelle interprtation en faites-vous (importance de leffet) ? Valeur de la significativit statistique p Interprtation : significativit clinique Quelle est la dure du suivi aprs mise en place de lintervention ? (dbut) Quelle est la dure du suivi aprs intervention ? (fin) A-t-on identifi un possible effet plafond ? (effet max = > plateau) Oui Remarque : ensemble de rponses o/n = non exclusive Non
Auteurs
Dr Pierre Durieux, Service de Sant Publique, Hpital europen Georges-Pompidou, Paris. Pr Philippe Ravaud, INSERM U738, Dpt dpidmiologie, de biostatistique et de recherche clinique, Groupe hospitalier BichatClaude-Bernard, Paris.
Groupe de lecture
Pr Serge Brianon, Sant Publique, Nancy. Dr Bernard Burnand, Mdecine sociale et prventive, Lausanne. Pr Isabelle Durand-Zaleski, Sant Publique,Crteil. Dr Hector Falcoff, Mdecin gnraliste, Paris. Pr Patrice Franois, Sant Publique, Grenoble. Dr Dominique Huas, Mdecin gnraliste, Nanterre. Mme Annick Macrez, Cadre infirmier, Paris. Dr Alexandre Pariente, Gastro-entrologue, Pau. Pr Isabelle Ray-Coquard, Oncologue, Lyon. Pr Pierre-Marie Roy, Anesthsie-ranimation, Angers. Dr Florence Saillour-Glenisson, Sant publique, Pessac. Mme Sophie Saisy-Callaert, Pharmacienne, Crteil. Dr Louis-Rachid Salmi, Sant Publique, Bordeaux.
Fiche descriptive
TITRE valuer limpact dinterventions destines amliorer les pratiques cliniques
Mthode de travail Guide Mthodologique Date de mise en Octobre 2007 ligne Objectifs
Prsenter les diffrentes caractristiques mthodologiques dune tude dintervention destine amliorer la qualit des soins, et les diffrentes tapes de sa ralisation Socits savantes, organismes et groupes de souhaitant valuer limpact dune intervention en sant Haute Autorit de sant
Recherche De janvier 2000 juin 2007 documentaire Auteurs Dr Pierre Durieux r du document P Philippe Ravaud Validation
Avis de la Commission valuation des stratgies de sant de la HAS. Validation par le Collge de la HAS en juin 2007.
www.has-sante.fr
ISBN :