Beruflich Dokumente
Kultur Dokumente
Ecole
Doctorale Informatique et Information pour la Societe
Conception de Syst`
emes Intelligents
pour la T
el
em
edecine Citoyenne
Th`
ese
presentee et soutenue publiquement le 29 Septembre 2006
pour lobtention du
Composition du jury
Rapporteurs:
Directeurs de th`ese:
Francois Charpillet
Joel Colloc
Paul Rubel
Examinateur
Jocelyne Fayn
Jean-Pierre Boissel
` tous celles et ceux qui mont aide pendant ces annees, un grand Merci.
A
vi
Introduction
II Aide `
a la d
ecision en m
edecine, le projet europ
een EPIMEDICS
5
1 Maladies cardiovasculaires, t
el
em
edecine et aide `
a la d
ecision
1.1 Contexte medical . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Le diagnostic . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Lelectrocardiologie quantitative . . . . . . . . . . . . . . . . . . .
1.2.1 LECG standard 12D . . . . . . . . . . . . . . . . . . . . .
1.2.2 LECG : les differentes ondes et les intervalles de temps . .
1.2.3 LECG, outil de detection du dysfonctionnement cardiaque
1.3 La telemedecine citoyenne : le projet EPI-MEDICS . . . . . . . .
1.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Evolution : passe, present et futur . . . . . . . . . . . . . .
1.3.3 EPI-MEDICS . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Laide `a la decision en medecine . . . . . . . . . . . . . . . . . . .
1.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Les syst`emes daide `a la decision . . . . . . . . . . . . . .
1.4.3 Les principales approches utilisees pour laide `a la decision
1.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
7
7
8
9
9
14
14
15
17
20
20
20
21
23
26
. 26
. 27
. 28
. 34
iv
2.3
2.4
2.2.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Quantification du risque cardiovasculaire par approche probabiliste . . .
2.3.1 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Les reseaux bayesiens . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Apprentissage des reseaux bayesiens . . . . . . . . . . . . . . . . .
2.3.4 Configuration du mod`ele probabiliste de stratification du risque cardiovasculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.5 La base de donnees INDANA . . . . . . . . . . . . . . . . . . . .
2.3.6 Realisation du reseau bayesien . . . . . . . . . . . . . . . . . . . .
2.3.7 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.8 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vers un mod`ele multi-classifieurs multi-modules du diagnostic de linfarctus : Interaction du module neuronal et du module bayesien dans le processus decisionnel global . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
45
48
50
52
59
.
.
.
.
.
.
60
61
62
64
64
65
. 65
.
.
.
.
.
68
68
69
71
72
73
. 74
. 74
.
.
.
.
.
.
.
.
74
75
76
79
82
82
83
84
. 85
. 85
. 87
.
.
.
.
.
88
88
89
90
91
v
3.8.5 Processus dapprentissage des reseaux de neurones generiques
3.8.6 Processus dapprentissage des reseaux de neurones specifiques
3.8.7 Verification et validation de la synth`ese de lECG 12D . . . .
3.8.8 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
91
93
93
95
105
106
IV
Conclusion g
en
erale
120
Bibliographie
124
Annexes
A Dossier M
edical Personnel embarqu
e dans le PEM
A.1 Contenu du dossier de sante du patient . . . . . . . .
A.2 Donnees demographiques . . . . . . . . . . . . . . . .
A.3 Resultats danalyses biologiques . . . . . . . . . . . .
A.4 Elements du dossier cardiologique . . . . . . . . . . .
A.4.1 Donnees cliniques . . . . . . . . . . . . . . . .
A.4.2 Interpretation de lECG au repos . . . . . . .
A.4.3 Resultats des tests de lECG deffort . . . . .
A.4.4 Diagnostic cardiologique . . . . . . . . . . . .
A.4.5 Procedures et traitements . . . . . . . . . . .
A.5 Facteurs de risque cardiovasculaire . . . . . . . . . .
A.5.1 Classe de Sante . . . . . . . . . . . . . . . . .
A.5.2 Facteurs de risque majeurs . . . . . . . . . . .
A.5.3 Autres facteurs de risque . . . . . . . . . . . .
135
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
136
. 136
. 136
. 137
. 137
. 137
. 137
. 138
. 138
. 139
. 139
. 139
. 139
. 140
vi
B La base de donn
ees INDANA
141
C Architecture des r
eseaux de neurones utilis
es pour la synth`
ese de lECG143
D SCPECG Processor
149
E EPI-MEDICS : mod`
eles de donn
ees globaux du PEM
152
F Publications
155
R
esum
e
158
2.2
2.3
2.4
2.5
2.6
2.7
3.1
3.2
3.3
Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage
est ensuite effectue sur les N 1 sous-ensembles s2 `a S5 et lerreur est calculee sur le sous-ensemble restant s1, servant de validation. Cette operation
est reiteree quatre fois en choisissant chaque fois un ensemble de validation
different. Enfin, un taux derreur moyen est calcule et lapprentissage est
refait en utilisant la totalite de lensemble de donnees. . . . . . . . . . . . .
Matrice de confusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG
durgence de lensemble de test, effectuee par les deux experts, en fonction
de la verite clinique (199 cas dinfarctus (AMI) et 789 cas de controle). Ce
tableau illustre les resultats de linterpretation unaire effectuee sur les ECG
durgence sans avoir eu connaissance des ECG de reference des patients. . .
Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse
serielle) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scores de risque en pourcentage de la survenue dune maladie coronaire en
fonction de lage, du sexe et des caracteristiques de la douleur de thoracique.
Dapr`es Diamond et Forrester, N Engl J Med 1979. . . . . . . . . . . . . .
Illustration du deroulement de lalgorithme de triangulation. Les clusters
retenus pour larbre de jonction sont marques par une etoile (*). . . . . . .
Variables retenues pour realiser les mod`eles de stratification : reseau bayesien,
comite de reseau de neurones et analyse discriminante. . . . . . . . . . . .
33
40
42
43
51
57
61
viii
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
ix
3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises `a partir des derivations DI, DII et V2 de lECG 12D Cardiette 2
par le comite de reseaux de neurones generiques (ANN-G) et par le mod`ele
de regression generique (REG-G). Le logiciel de diagnostic classe les ECG
suivant 4 categories de risque : pas de risque, risque mineur, moyen et majeur.103
3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques
(REG-S). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits
`a partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 104
3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits
`a partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 105
B.1 Tableau descriptif des variables et labels de la base de donnees INDANA . 142
1.4
1.5
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
xi
2.10 Illustration dalgorithmes de stratification du risque cardiovasculaire developpes
dans le cadre dEPI-MEDICS. . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.11 Reseau bayesien simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.12 Reseau bayesien bug an 2000. . . . . . . . . . . . . . . . . . . . . . . . . 55
2.13 Meme graphe que Figure 2.12 apr`es moralisation. . . . . . . . . . . . . . . 55
2.14 Meme graphe que Figure 2.12 apr`es triangulation. . . . . . . . . . . . . . . 56
2.15 Larbre de jonction obtenu `a partir du reseau bayesien avec les clusters
retenus du processus de triangulation (ovales) et les separateurs induits
(carres). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire. . . . . . . . 63
2.17 Illustration de la structure individuelle des reseaux de neurones utilises
pour estimer le risque cardiovasculaire. . . . . . . . . . . . . . . . . . . . . 64
2.18 Proposition dun mod`ele decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun syst`eme de r`egles de
logique floue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
70
76
77
84
86
92
94
95
102
xii
3.10 Illustration de la qualite de synth`ese de lECG standard 12D `a partir de
lECG PEM 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1
4.2
4.3
4.4
4.5
4.6
109
110
111
112
116
118
Premi`
ere partie
Introduction
Introduction
Contexte
Les maladies cardiovasculaires representent de nos jours la principale cause de mortalite en France et en Europe [1]. Or, la majorite des dec`es dorigine cardiaque surviennent
dans la phase pre-hospitali`ere [2, 3, 4, 5]. Une detection precoce des differents cardiopathies permettrait dassurer une prise en charge adequate, dameliorer la qualite de vie des
patients et de reduire le co
ut pour la societe. Il sagit l`a de lobjectif ultime du projet europeen EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection &
Interpretation of Cardiovascular Syndromes) [6]. Ce projet, qui sinscrit dans le droit fil
de ce que lon appelle aujourdhui la telemedecine citoyenne, propose la creation dun
syst`eme intelligent portable et utilisable par tous, le PEM (Personal ECG Monitor),
pour detecter les arythmies et diagnostiquer les infarctus d`es lapparition des premiers
symptomes [7]. Moyennant lacquisition dun electrocardiogramme (ECG) par lutilisateur (citoyen/patient), le PEM a pour vocation de stratifier le risque de la survenue dun
ev`enement cardiovasculaire (arythmie, ischemie), de generer differents niveaux dalarmes
et de transmettre les donnees stockees dans le PEM aux professionnels de sante ou aux
structures durgence concernes.
Pour atteindre ces objectifs, il est necessaire de resoudre une variete de probl`emes lies
aux cycles de fonctionnement du syst`eme : de lacquisition et lenregistrement de lECG
`a linterpretation des donnees recueillies, jusqu`a lemission et la gestion des alarmes.
Cela impose de concevoir des solutions innovantes `a ces probl`emes tr`es particuliers lies
`a la telemedecine citoyenne et de developper une plateforme logicielle pervasive basee en
grande partie sur des composants embarques dans le PEM.
Parmi les differentes problematiques `a resoudre, la plus importante et sans doute la
plus difficile est de rendre le syst`eme de decision auto adaptatif en fonction de la specificite
du patient et auto-ameliorant en fonction des eventuelles fausses alarmes ou detections
manquees. Les methodes `a mettre en uvre rel`event des domaines de lintelligence artificielle et de laide `a la decision (fusion des donnees, logique floue, approche neuronale,
etc.).
Partant dune premi`ere solution consistant `a interpreter les ECG standards `a 12
3
derivations (ECG 12D) au moyen de comites de reseaux de neurones, nous chercherons `a
ameliorer lintelligence du syst`eme en stratifiant le risque de survenue dun ev`enement cardiovasculaire en combinant linterpretation de lECG avec lhistorique clinique du patient.
Il sagit en loccurrence dun probl`eme daide au diagnostic consistant `a mettre en uvre
des algorithmes (reseaux de neurones, reseaux bayesiens. . . ) resolvant un probl`eme de classement tenant compte de lincertitude sur la situation reelle de lobjet etudie. Considerant
quil nexiste pas dultime methode, nous essayerons de tirer profit des points forts de
chacune des methodes daide `a la decision existantes en proposant un mod`ele hybride,
multi-experts, multi-modules forme dune combinaison de classifieurs et de methodes de
classement pour interpreter lECG du patient, tout en tenant compte des facteurs de
risque (antecedents cardiaques, cholesterol, tabagisme. . . ) propres `a lutilisateur concerne
afin de declencher lalarme la plus appropriee.
Une deuxi`eme problematique est de permettre lenregistrement de lECG par lutilisateur avec le minimum dassistance professionnelle, et de rendre cet ECG accessible,
sous un format comprehensible et interpretable, aux professionnels de sante (cardiologue,
medecin traitant). Il est donc imperatif de proposer lutilisation dun syst`eme denregistrement simplifie permettant de recueillir lessentiel de linformation spatio-temporelle
contenue dans lECG 12-D avec un nombre minimum delectrodes faciles `a placer par le
patient lui-meme. La solution proposee par le projet EPI-MEDICS est denregistrer un
ECG PEM simplifie consistant en 3 derivations pseudo-orthogonales (DI, DII, V2) formant un sous-ensemble de lECG standard `a 12 derivations, ramenant ainsi le nombre
delectrodes actives necessaires `a lenregistrement de lECG PEM de 9 `a 4. Encore fautil, pour une bonne acceptabilite de lapproche EPI-MEDICS par les professionnels de
sante, proposer des moyens permettant de transformer lECG PEM en ECG 12-D, seule
forme delectrocardiogramme que les cardiologues ont lhabitude dinterpreter avec une
tr`es grande precision. Les methodes habituellement utilisees pour synthetiser un ECG
standard 12-D `a partir dun nombre reduit delectrodes reposent sur des techniques de
regression lineaire multiple. Nous proposons dans ce memoire une methode de reconstruction non-lineaire originale basee sur lutilisation de reseaux de neurones que nous
validerons sur plusieurs bases de donnees ECG serielles que nous avons selectionne pour
etre le plus representatives possible du type de populations detudes concernees par une
utilisation future du PEM. Notre validation sera realisee tant en termes de contenu informationnel vis `a vis de la capacite de detecter un infarctus quen termes de qualite de la
reconstruction des differents echantillons des signaux manquants.
Enfin, nous terminons ce memoire en proposant une architecture de deploiement de
la plateforme decisionnelle du PEM dans le contexte des syst`emes dinformation et de
communication pervasifs integrant des serveurs web applicatifs et des grilles de calcul.
Le chapitre 1 est consacre `a la presentation du contexte medical de nos recherches : les
maladies cardiovasculaires, et en particulier levocation des causes, des effets et consequences
de linfarctus du myocarde. De meme, nous faisons le point sur les differents moyens de
prevention (facteurs de risque) et de diagnostic (ECG) de linfarctus du myocarde. Ensuite, nous presentons le contexte applicatif de la th`ese, `a savoir la telemedecine citoyenne
4
et le projet europeen EPI-MEDICS, tout en mettant laccent sur le produit phare du projet : le PEM. Enfin, nous abordons la discipline daide `a la decision en medecine et les
principales techniques dintelligence artificielle utilisees en informatique medicale pour
diagnostiquer une pathologie `a partir dindicateurs preleves sur le patient (ECG. . . ).
Le chapitre 2 presente la plateforme daide `a la decision que nous avons developpee
pour diagnostiquer linfarctus du myocarde. La realisation de cette plateforme est basee
sur une approche multi-modules, multi-experts utilisant des methodes de classement du
domaine de lintelligence artificielle. Elle permet detablir une probabilite de la survenue
de lev`enement cardiovasculaire `a partir de :
Linterpretation de lECG PEM : Cette interpretation est effectuee `a laide de comites de reseaux de neurones artificiels sur les ECG enregistres par lutilisateur
lui-meme.
La stratification des facteurs de risque : il sagit destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur les facteurs de risque, les
donnees cliniques, etc. prealablement stockes dans le dossier medical de lutilisateur
du PEM. Nous proposons une solution `a base de reseaux bayesiens.
Enfin, pour combiner linterpretation de lECG avec le resultat de la stratification
des facteurs de risque, nous proposons un mod`ele decisionnel global incorporant les
modules bayesien et neuronal qui collaborent par lintermediaire dun syst`eme de
r`egles de logique floue.
Le chapitre 3 est devolu `a la presentation de solutions permettant la reconstruction de
lECG standard 12D `a partir de lECG PEM 3D enregistre par lutilisateur du PEM. Lobjectif est de permettre non seulement une detection precise de lischemie, mais egalement
une reproduction la plus fid`ele possible des caracteristiques enregistrees par lECG 12D
standard si ce dernier etait enregistre simultanement avec lECG 3D du PEM. Nous proposons deux approches : lune generique visant `a construire un module de synth`ese applicable
`a tout patient, lautre specifique `a chaque patient, et des solutions `a base de comites de
reseaux de neurones artificiels que nous comparerons `a des solutions plus traditionnelles
basees sur la synth`ese au moyen de matrices de transformations lineaires obtenues par
regression lineaire multiple.
Enfin, le chapitre 4 est consacre `a la presentation des aspects lies au deploiement et
`a la maintenance des modules daide `a la decision du PEM, en particulier le module
neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes,
ainsi que les strategies de deploiement du module de reconstruction de lECG par comites
de reseaux de neurones.
Deuxi`
eme partie
Aide `
a la d
ecision en m
edecine, le
projet europ
een EPI-MEDICS
Chapitre 1
Maladies cardiovasculaires,
t
el
em
edecine et aide `
a la d
ecision
1.1
Contexte m
edical
Linfarctus du myocarde est la consequence dune occlusion coronaire brutale. Cela declenche une
ischemie myocardique regionale sev`ere qui, si elle se perennise, engendre des lesions cellulaires irreversibles.
1.1.1
Le diagnostic
Le diagnostic clinique
Le symptome classique de linfarctus du myocarde dans sa forme typique est la douleur thoracique. Cette douleur dure au moins 20 minutes, elle est violente, parfois insupportable. Elle irradie souvent aux membres superieurs vers le bord cubital, la machoire
inferieure. Elle peut egalement irradier vers lepigastre, mais jamais en dessous de lombilic.
Linfarctus du myocarde debute presque toujours sans cause declenchante evidente,
avec un horaire dapparition predominant dans les heures de la matinee, mais pouvant
setaler sur lensemble des 24 heures. Il peut apparatre au cours dun effort physique, par
exemple sportif ; dans ce cas larret de leffort ne permet pas de le faire ceder. La douleur
peut etre absente, la symptomatologie peut alors se limiter `a des signes digestifs (nausees,
vomissement, gene epigastrique, etc.).
Le diagnostic biologique
Les lesions cellulaires causees par linfarctus entranent une perte detancheite membranaire, voire une lyse de la membrane cellulaire. Il en resulte une liberation de molecules
intra-cytoplasmiques. D`es lors des enzymes myocardiques (la myoglobine, la myosine, etc.)
seront retrouvees dans le sang peripherique, et peuvent y etre reperees via une analyse
biologique.
1.2
L
electrocardiologie quantitative
Le diagnostic precoce de linfarctus nest pas chose facile. Les douleurs thoraciques
peuvent avoir dautres causes que linfarctus, et certains episodes ischemiques sont silencieux, notamment en cas de diab`ete. Le seul element daide `a la decision objectif et facile
`a mettre en uvre en situation pre-hospitali`ere pour faire le diagnostic dun evenement
cardiaque et de sa severite (angine de poitrine, infarctus aigu, risque de dec`es, etc.) et
pour guider les traitements est lelectrocardiogramme (ECG) [13].
LECG est une representation de lactivite electrique du coeur enregistree par
des electrodes placees sur la surface du corps. Les differents modes denregistrements
1.2.1
3
2
3
2
3
2
VR
VL
VF
1.2.2
LECG est le temoin direct de differentes phases cycliques (Figure 1.1), indiquant les
grandes etapes de lactivation electrique du coeur :
la depolarisation des oreillettes : onde P
la depolarisation des ventricules : onde QRS
la repolarisation des ventricules : onde T
Les intervalles de temps generalement consideres sont, outre la duree de QRS :
la duree dune depolarisation et repolarisation ventriculaire : intervalle QT
la duree dun cycle ventriculaire complet : intervalle RR
la duree dun cycle atrial complet : intervalle PP
1.2.3
LECG, outil de d
etection du dysfonctionnement cardiaque
De nos jours, LECG est considere comme un moyen fiable, non-invasif, de faible
co
ut, et surtout de detection precoce dun nombre considerable danomalies cardiaques
(infarctus, arythmie, etc. ) qui depasse de loin les techniques dimagerie habituelles. En
plus, lapport technologique a ouvert une nouvelle `ere de lexploration du champ electrique
cardiaque baptisee lelectrocardiologie quantitative, ou numerique.
10
Fig. 1.1 ECG standard 12D : positionnement des electrodes, ondes et intervalles. Dapr`es
the ECG learning center. http ://medlib.med.utah.edu/kw/ecg
11
12
13
Lanalyse et linterpr
etation automatique des ECG
Lav`enement de lECG numerique et le developpement de linformatique ont rendu
possible lanalyse et linterpretation automatique des ECG.
Les premiers travaux remontent au debut des annees 60. Mais lECG nest devenu
veritablement numerique quavec lapparition des microprocesseurs au milieu et `a la fin
des annees 70. Aujourdhui au moins 90% des electrocardiographes vendus aux Etats
Unis ou en Europe incluent un module danalyse et dinterpretation automatique des
ECG. Il sagit, `a notre connaissance, dune des rares applications medicales pour laquelle
les syst`emes experts sont sortis des laboratoires de recherche et sont utilises en routine
clinique dans des environnements differents de leur lieu dorigine. Ceci na ete rendu
possible que grace `a une action de recherche internationale concertee qui a dure plus de
15 ans et a permis de constituer differentes bases de donnees permettant de valider les
algorithmes danalyse et dinterpretation automatique de lECG, laction CSE Common
Standards for quantitative Electrocardiography [21].
Typiquement, un outil informatique danalyse automatique de lECG consiste en un
ensemble de modules permettant lacquisition du signal, lanalyse et linterpretation du
rythme, la detection dun complexe QRS type, la reconnaissance des differentes ondes,
lextraction dun ensemble de param`etres destines `a caracteriser le signal et son affectation
`a une ou plusieurs classes de diagnostic, cest `a dire realisant les differentes etapes de ce
que lon appelle plus communement une reconnaissance de formes.
Lapproche traditionnelle est principalement basee sur des descripteurs morphologiques et temporels du signal familiers aux cliniciens tels que la presence ou labsence
dune onde Q, le rapport de R/S. . . La deuxi`eme approche extrait des descripteurs quantitatifs au moyen doutils mathematiques tels que la transformee de Fourier, lanalyse
en ondelettes, etc. Ces descripteurs sont par la suite utilises par des methodes issues de
lintelligence artificielle (analyse discriminante, reseaux de neurones, logique floue, ou des
syst`emes `a base de r`egles) pour realiser une interpretation automatique de lECG [22].
Plusieurs dizaines de syst`emes danalyse automatique de lECG ont ete developpes
[23], mais tr`es peu ont ete experimentes en milieu hospitalier, dont notamment le syst`eme
danalyse et dinterpretation automatique des ECG/VCG connu sous le nom de Syst`eme
de Lyon. Ce syst`eme permet lenregistrement dECG 12D ou de VCG, la determination
du complexe QRS type `a laide dun algorithme de classification non hierarchique, et
realise linterpretation automatique du contour grace `a une approche de type heuristique
mettant en uvre des logiques ternaires (alg`ebre de Post) [24]. Plus recemment, dautres
syst`emes bases sur des methodes issues de lintelligence artificielle (logique floue, syst`emes
14
experts, reseaux de neurones, etc.) ont ete developpes et commencent `a etre implantes en
milieu hospitalier, en ambulatoire ou `a domicile [7].
1.3
1.3.1
La t
el
em
edecine citoyenne : le projet EPIMEDICS
Introduction
15
[33],
interpreter des donnees medicales `a distance : teleexpertise (par exemple, interrogation dun specialiste en lui transmettant les donnees sur le patient pour un diagnostic
complementaire) [34, 35],
ou assurer une surveillance `a domicile des patients : telesurveillance (par exemple,
suivi des personnes agees `a domicile [36, 37], suivi dune grossesse `a risque, etc.).
1.3.2
Evolution : pass
e, pr
esent et futur
16
17
developpement dinfrastructures de communication pervasives, mobiles et faciles `a utiliser, la miniaturisation la plus importante possible des microcomposants, la baisse de leur
co
ut et laugmentation de leurs performances, et la construction de syst`emes de gestion
bases sur le contexte et des interfaces naturelles et personnalisees.
Un exemple type de cette evolution vers la telemedecine citoyenne est le projet EPIMEDICS, que nous presentons bri`evement ci-apr`es.
1.3.3
EPI-MEDICS
Le projet EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection
& Interpretation of Cardiovascular Syndromes) (Figure 1.4) a deux objectifs principaux
[47] :
detecter, aussitot que possible, le debut dune ischemie ou dune arythmie en enregistrant les changements des ECG des patients `a risque,
impliquer sans delai, mais seulement si necessaire, les structures de sante.
Pour realiser ces objectifs et en particulier pour detecter de mani`ere precoce les dysfonctionnements cardiaques d`es lapparition des premiers symptomes, `a domicile ou en
ambulatoire, EPI-MEDICS a developpe un moniteur personnel dECG (PEM : Personal
uteux, de petite taille, intelligent et facile dutilisation,
ECG Monitor) (Figure 1.5) peu co
dote dun serveur embarque et dun composant metier danalyse quantitative de lECG.
Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des
informations spatio-temporelles produite par lactivite du cur et denvoyer via Bluetooth
et GPRS ou UMTS differents types de messages ou dalarmes convoyant des ECG et un
mini-dossier medical de lutilisateur aux services de sante concernes, grace `a des telephones
portables de 2`eme ou 3`eme generation. Le seul equipement requis pour les professionnels
de sante est une connexion Internet. Tous les messages du patient aux medecins sont ecrits
en XML [48] et encapsulent les donnees des ECG suivant le standard SCP-ECG. Ce mode
de fonctionnement est cense faciliter lacceptation du PEM par les professionnels de sante
et devrait permettre une tr`es large diffusion de ce concept.
Le syst`eme de decision embarque dans le PEM comporte quatre sous-ensembles :
detection des arythmies 5 , des ischemies 6 , generation dalarmes et de leur niveau prenant
si possible en consideration des informations cliniques telles que les facteurs de risque du
patient, gestion de lenvoi des alarmes tenant compte des non-reponses eventuelles des
serveurs dalarme ou des professionnels de sante contactes, etc.
5
Der`eglement dans le syst`eme de conduction electrique du coeur (rythme trop lent lorsquil sagit de
bradycardie ; ou trop rapide, on parle alors de tachycardie) pouvant entraner des consequences plus ou
moins graves : etourdissements, nausees, vertiges, palpitations, douleurs, etc.
6
Arret ou insuffisance de la circulation sanguine dans une partie du corps ou un organe, qui prive les
cellules dapport doxyg`ene et entrane leur necrose. Les infarctus sont consecutifs `a des ischemies.
18
19
Fig. 1.5 Illustration dun des 70 prototypes PEM (Personal ECG Monitor) developpes
dans le cadre du projet EPI-MEDICS pour permettre la detection precoce des syndromes
cardiaques dans un contexte de telemedecine citoyenne.
La realisation de la plateforme decisionnelle du PEM na ete rendue realisable que
grace `a lapport de differentes techniques dintelligence artificielle automatisant les processus daide `a la decision implementes dans le PEM. Tous ne sont dailleurs pas encore
operationnels. Seuls ont ete experimentes sur le terrain une premi`ere version des modules
de detection darythmies et dischemie et de generation des alarmes. Leur optimisation
et plus particuli`erement la prise en compte des informations cliniques pour ameliorer la
decision constituent justement lun des principaux apports de ce memoire.
Dans la suite de ce chapitre, nous exposerons bri`evement levolution de laide `a la
decision en medecine, en mettant laccent sur les syst`emes daide `a la decision et en general
les principales methodes developpees dans le cadre de cette discipline. Dans le chapitre
2, nous presenterons en detail les techniques que nous avons adoptees pour concevoir les
modules decisionnels susceptibles detre integres dans la plateforme daide `a la decision
du PEM : le module dinterpretation de lECG et celui de la stratification des facteurs de
risque. Enfin, dans le chapitre 4, nous presenterons les aspects lies au deploiement de ces
modules daide `a la decision, des modules de gestion et denvoi dalarme, . . . qui ont ou
qui vont etre installes dans le PEM.
1.4
1.4.1
20
Laide `
a la d
ecision en m
edecine
G
en
eralit
es
La medecine est une discipline qui requiert une prise de decision. Ce processus resulte
de la confrontation dun probl`eme reel `a lexperience acquise (savoir-faire) et `a un corpus
de connaissances theoriques (savoir) dans le but deffectuer un choix. La difficulte de la
prise de decision en medecine vient de la situation dincertitude, qui tient `a plusieurs
raisons :
lincertitude sur les connaissances : certaines connaissances sont dordre statistique
et sont associees par nature `a un risque derreur, mais dautres connaissances sont
incompl`etes, par defaut dexploration ;
lincertitude sur les faits : la description de letat present nest jamais parfaite, soit
par manque de moyens ou de temps (urgence), soit par defaut de mesure ou mauvaise
interpretation dun symptome, dun signe ou dun resultat ;
lincertitude du langage : le flou et lambigute des notions manipulees perturbent
le traitement et la transmission de linformation.
1.4.2
Les syst`
emes daide `
a la d
ecision
Les avancees de linformatique et plus particuli`erement lav`enement des syst`emes dinformation, les bases de donnees, les dossiers informatises, etc. ont facilite la prise de
decision medicale en ameliorant lacc`es aux donnees pertinentes. Neanmoins, il ne sagit
l`a que dune aide indirecte facilitant lacc`es aux presentations des faits sur lesquels le praticien doit appliquer un raisonnement. Les syst`emes daide `a la decision vont beaucoup
plus loin : ils ont lambition dassister lhomme, et dans certaines situations, en particulier `a domicile ou en ambulatoire, `a le suppleer en remplacant ou en reproduisant le
raisonnement humain [49].
Caract
eristiques
Plusieurs caracteristiques permettent de decrire les syst`emes daide `a la decision suivant le type de probl`eme `a resoudre, le mode dintervention, la nature de linteraction, ou
enfin la technique employee.
Applications
Les syst`emes daide `a la decision peuvent sappliquer `a deux types de probl`emes :
21
Fonctionnement
Plusieurs modes de fonctionnement sont possibles :
le mode passif suppose lintervention explicite et directe de lutilisateur pour decrire
le probl`eme (par exemple, letat du patient) et interroger le syst`eme.
le mode semi-actif correspond `a un syst`eme dont le declenchement automatique
repond `a une intervention humaine (par exemple, le syst`eme dalarme qui alerte sur
un changement detat du patient, comme dans le cadre dEPI-MEDICS).
le mode actif est celui dun syst`eme `a declenchement automatique et autonome (par
exemple, un syst`eme de telesurveillance).
1.4.3
Approche neuronale
Il sagit de methodes inspirees des structures neuronales et du fonctionnement cerebral,
do`
u le nom frequent de reseau de neurones artificiels [52].
Le reseau neuronal est un programme qui met en jeu des neurones relies entre eux par
des connexions. Chaque neurone realise la sommation des stimuli des neurones afferents,
chaque connexion etant affectee dune ponderation. Cette sommation obeit `a differentes
formes de fonctions, dites de transfert ou dactivation (tout ou rien, fonction en escalier,
22
Approche statistique
Lapproche statistique [53] concerne essentiellement les methodes de regression ou
de classement multidimensionnelles qui permettent dexpliquer la valeur dune reponse ou
lappartenance `a un groupe en fonction des valeurs de plusieurs variables dites explicatives.
Il sagit notamment de lanalyse discriminante, de la regression logistique dans le cas
dune reponse qualitative, de la regression multiple dans le cas dune reponse quantitative,
ou du mod`ele de Cox dans le cas dune variable de reponse censuree (analyse de survie).
Ces methodes repondent `a deux objectifs : reduire le nombre souvent considerable de
variables potentiellement explicatives `a un sous-ensemble dusage et obtenir dune mani`ere
plus aisee une equation predictive.
Etant probablement la methode statistique de classement la plus utilisee, lanalyse
discriminante lineaire est une methode de reconnaissance de formes statistique basee sur
une technique dapprentissage supervise, tr`es facile `a mettre en uvre [54]. Le but est
de determiner la classe dune observation en calculant la distance de Mahalanobis entre
lobservation et le centre de chacune des classes et en affectant lobservation `a la classe
pour laquelle la distance de Mahalanobis est minimale.
Le mod`ele est etabli `a partir dun un ensemble dobservations (ensemble dapprentis` partir de cet ensemble dapprentissage,
sage) pour lesquelles les classes sont connues. A
lanalyse discriminante etablit un ensemble de fonctions lineaires des facteurs predictifs,
connues sous le nom de fonctions discriminantes, du type :
Y = v1 X1 + v2 X2 + . . . + vn Xn + C
(1.1)
o`
u les vi sont des coefficients discriminants, les xi sont les variables dentree (les facteurs
predictifs) et le C est une constante.
Ces fonctions discriminantes sont employees pour prevoir la classe dune nouvelle observation. Pour un probl`eme de classement avec k classes, k fonctions discriminantes sont
construites. Etant donnee une nouvelle observation, toutes les fonctions discriminantes
sont evaluees et lobservation est assignee `a la classe i si la i`eme fonction discriminante a
la valeur la plus elevee.
23
Approche probabiliste
Lapproche probabiliste, reposant sur lapplication du theor`eme de Bayes, permet de
calculer la probabilite dune maladie connaissant les signes du malade. Lapplication sur
un probl`eme de diagnostic medical du theor`eme de Bayes etablit que la probabilite a
posteriori dun diagnostic Di , lorsque le signe S est present, est fonction de la probabilite
a priori du diagnostic et de la probabilite conditionnelle dobserver le signe lorsque le
diagnostic est present :
P (Di /S) =
P (Di ) P (S/Di )
P (Di ) P (S/Di )
= P
P (S)
( j P (Dj )P (S/Dj ))
(1.2)
La methode bayesienne tient compte des signes positifs et negatifs et permet de calculer
le diagnostic le plus probable [55]. La determination des probabilites a priori (incidence
de la maladie) et des probabilites conditionnelles (frequence dun signe dans une maladie) suppose lexploitation dune base de donnees medicales enregistrant les signes et le
diagnostic de chaque cas.
Approche symbolique
Il sagit essentiellement des syst`emes dits experts [56] qui sont des logiciels de
resolution de probl`emes, qui permettent de representer sous forme explicite et declarative
les connaissances et le comportement dun expert humain, afin quil puisse etre reproduit
par un programme. Les limites de cette approche tiennent aux contraintes de formulation
de la connaissance (connaissance imparfaite, relations multiples, difficulte de formalisation
du raisonnement, contrainte du dialogue avec lutilisateur, necessite de consensus).
1.4.4
Conclusion
Laide `a la decision est une discipline qui a suscite beaucoup dinteret au cours des
derni`eres decennies et enormement de methodes ont dej`a vu le jour. Cependant, aucune
methode ne sest imposee comme etant la methode de reference et la tendance au cours
de ces derni`eres annees fut lessor des syst`emes hybrides o`
u les resultats de plusieurs
methodes daide `a la decision sont combines. En effet, `a linstar des syst`emes multi-experts
o`
u la combinaison des interpretations de plusieurs experts est plus performante que celle
de chacun des experts pris individuellement [25], la combinaison des resultats de plusieurs
classifieurs (comites de reseaux de neurones) conduit `a des resultats de meilleure qualite
que ceux du meilleur classifieur (meilleur reseau de neurones du comite) [57]. De meme,
la combinaison des resultats de plusieurs methodes de classement (fusion de donnees
via des heuristiques entre un comite de reseaux de neurones et un reseau bayesien) sera
probablement plus performante que nimporte quelle methode consideree individuellement
24
[58]. Cest ce concept que nous allons developper dans le prochain chapitre : Aide `a la
decision en telecardiologie.
Troisi`
eme partie
Conception, validation et strat
egies
de d
eploiement de la plateforme
d
ecisionnelle dEPI-MEDICS
25
Chapitre 2
Aide `
a la d
ecision en t
el
ecardiologie
2.1
Contexte et objectifs
Comme dej`a indique dans lintroduction de ce memoire, lobjectif principal dEPIMEDICS est de permettre la detection precoce de linfarctus du myocarde d`es lapparition des premiers symptomes afin de pouvoir intervenir rapidement et administrer un
traitement immediat et efficace.
Dans ce contexte, lECG, grace `a son caract`ere non-invasif, sa rapidite de mise en
uvre, et son faible co
ut reste un examen objectif de choix. Cependant, comme evoque
dans le chapitre 1, sa performance diagnostique reste limitee. Ainsi Pope et al [18] ont
montre quen pratique clinique lorsque lon applique les crit`eres ECG classiques de diagnostic de linfarctus, au moins 25% des patients qui avaient un infarctus du myocarde
ne sont pas diagnostiques et sont renvoyes de lhopital sans traitement. Sans doute de
nouvelles methodes de reconnaissance de forme combinees `a de nouvelles methodes de
traitement du signal (analyse en ondelettes, etc.) pourront elles permettre dameliorer
ces performances. Les resultats de laction CSE ont montre en effet que les meilleurs
programmes danalyse automatique de lECG sont aussi performants que les meilleurs
cardiologues [25]. Mais il faut savoir aussi que la performance des cardiologues est accrue
lorsquils connaissent le contexte du patient. En effet, de nombreuses etudes [59, 60, 61, 62]
ont montre que lanalyse de lECG combinee avec lhistorique clinique et les resultats des
derni`eres analyses medicales du patient est le meilleur moyen pour effectuer un diagnostic precoce de linfarctus du myocarde, en particulier dans un contexte durgence ou en
ambulatoire.
La principale problematique est donc de pouvoir trouver la meilleure solution pour
fusionner des donnees de nature differente (dichotomique, categorique et continue), en
provenance de sources diverses (ECG, donnees cliniques,. . . ) afin detablir un score de
risque et declencher une alarme appropriee. Or ce domaine de la fusion de donnees est
devenu particuli`erement important pour un grand nombre dapplications tels que la ro-
27
2.2
Interpr
etation automatique de lECG
28
tout autre car ici lon cherche avant tout `a privilegier la performance de la detection
dune ischemie ou dun infarctus aigue en minimisant le nombre de faux positifs et de
faux negatifs sachant que par ailleurs lon envoie lECG au cardiologue pour quil puisse
controler sil le juge utile la qualite de linterpretation. Dans ce contexte, lutilisation de
comites de reseaux de neurones artificiels parat extremement pertinente. Les reseaux de
neurones en effet constituent un paradigme informatique de reconnaissance de formes qui
sest avere tr`es prometteur pour resoudre des applications de medecine en general [65] et
plus particuli`erement le diagnostic de linfarctus. De nombreuses etudes ont demontre la
qualite de linterpretation automatique de lECG par reseaux de neurones dans le cadre
dun scenario de diagnostic de linfarctus du myocarde. Parmi ces etudes, il convient de
citer plus particuli`erement Baxt [66] et Harrison et al. [67] qui ont utilise lhistorique
medical du patient ainsi que des donnees dECG et des donnees cliniques comme entrees
du reseau de neurones. Des etudes plus recentes [68, 69] ont utilise les reseaux de neurones
dans le but de faire un outil daide `a la decision dedie aux services durgence. Utilisant
uniquement lECG 12D comme donnees dentree au reseau de neurones, Heden et al. [70]
pouvaient detecter linfarctus avec un taux de reussite egal voire meilleur qu`a celui dun
cardiologue experimente. Une autre etude [22] a montre linteret dutiliser des param`etres
seriels de lECG pour diagnostiquer linfarctus.
Dans le reste de cette section, nous allons presenter les reseaux de neurones, les
mecanismes dapprentissage ainsi que les techniques doptimisation, en particulier lapproche multi-expert par des comites de reseaux de neurones. Ensuite, nous allons presenter
les methodes statistiques utilisees comme temoin de comparaison avec les reseaux de neurones : lanalyse discriminante. Enfin, nous presentons les evaluations effectuees sur une
base de donnees ECG, la base de donnees de Lund, par rapport `a lanalyse discriminante
et deux experts humains : un cardiologue experimente et un medecin interne.
2.2.1
Les r
eseaux de neurones
D
efinition
Les reseaux de neurones artificiels sont des mod`eles de calcul dont la conception est
tr`es schematiquement inspiree du fonctionnement cerebral et des structures neuronales.
Ils sont generalement optimises par des methodes dapprentissage de type statistique qui
leur permettent de prendre des decisions sappuyant davantage sur la perception que sur
le raisonnement logique formel [71].
29
qui le prec`edent. Chacune de ces connexions recoit une ponderation qui determine son
impact sur les neurones quelle connecte. Chaque neurone dispose ainsi dune entree,
qui lui permet de recevoir de linformation dautres neurones, mais aussi dune fonction
dactivation, qui est dans les cas les plus simples, une simple fonction identite du resultat
obtenu par lentree, et enfin une sortie (Figure 2.1).
Fig. 2.1 Fonctionnement des neurones : chaque neurone m additionne les valeurs de ses
entrees (n1 , n2 , n3 ) multipliees par des poids (W1 , W2 , W3 ), passe le resultat dans une
fonction dactivation, et le renvoie aux neurones qui le suivent.
Le choix dune fonction dactivation se rev`ele etre un element constitutif important
des reseaux de neurones. Le plus souvent des fonctions non lineaires seront necessaires.
Les fonctions couramment utilisees comme fonctions dactivation sont (Figure 2.2) :
La fonction logistique :
1
(2.1)
Y = F (X) =
(1 + e(dX) )
La fonction tangente hyperbolique :
Y =
2
1
(1 + e(2X) )
(2.2)
(2.3)
Types de r
eseaux
Les reseaux de neurones ont suscite beaucoup dinteret au cours des derni`eres decennies
et enormement de variantes ont dej`a vu le jour : les perceptrons multi-couches [72], les
reseaux de Kohonen [73, 74], les reseaux de Hopfield [75], etc.
30
La couche dentree recoit les donnees sources que lon veut utiliser pour lanalyse.
Dans le cas de laide au diagnostic medical, cette couche recevra les symptomes. Sa
taille est donc directement determinee par le nombre de variables dentrees.
La couche de sortie donne le resultat obtenu. Dans le cas de laide au diagnostic
medical, cette couche donne le diagnostic sous forme dune probabilite entre 0 (sujet
sain), et 1 (diagnostic confirme). Sa taille est directement determinee par le nombre
de variables (ou diagnostic) quon veut en sortie.
La couche intermediaire est dite cachee dans le sens quelle na quune utilite intrins`eque pour le reseau de neurones et na pas de contact direct avec lexterieur.
Le principe de fonctionnement est le suivant : nous disposons initialement dune base
de connaissances constituee de couples de donnees entrees / sorties (symptomes, signes
cliniques / pathologie) et nous souhaitons utiliser cette base de donnees pour configurer
et entraner le reseau de neurones, grace `a un algorithme informatique, `a reproduire les
associations constatees entre les entrees et les sorties de la base de connaissances.
Les fonctions dactivation de la couche cachee sont en general non lineaires mais il ny
a pas de r`egle `a respecter. Le choix du nombre de couches cachees et de leur taille nest pas
implicite et doit etre ajuste. En general, plusieurs tests sont necessaires. On commence
par exemple par prendre une moyenne du nombre de neurones des couches dentree et de
sortie, mais ce nest pas toujours le meilleur choix. Il est donc souvent necessaire, pour
obtenir de bons resultats, dessayer le plus de tailles possibles.
31
Elaboration de la structure du r
eseau La structure du reseau depend etroitement
du type de reseau : un perceptron standard, un reseau de Hopfield, un reseau de Kohonen,
etc. Ensuite en fonction du type choisi, lelaboration de la structure du reseau peut varier :
dans le cas du perceptron, il faudra aussi determiner le nombre de neurones dans la couche
cachee.
32
lapprentissage.
Par la suite, dans le cadre de notre application, du fait que nous disposons de la verite sur
la sortie du reseau, nous nous interesserons surtout `a lapprentissage supervise que nous
allons detailler ci-apr`es.
Apprentissage par r
etropropagation La methode dapprentissage supervise la plus
utilisee est la retropropagation [76]. Le principe de la retropropagation consiste `a alimenter
le reseau de neurones par les donnees de lensemble dapprentissage, et en fonction de
lerreur obtenue en sortie par rapport `a la verite (sortie de lensemble), nous corrigeons
les poids accordes aux neurones.
On montre chaque exemple au reseau de neurones, puis on propage ces valeurs
vers la sortie. La prediction que lon obtient en sortie est au debut erronee.
On calcule la valeur de lerreur (cest `a dire la difference entre les valeurs desirees
et les valeurs predites), puis on retropropage cette erreur en remontant le reseau
et en modifiant les poids proportionnellement `a la contribution de chacun `a lerreur
totale.
On rep`ete ce mecanisme pour chaque exemple de donnees et tant que le taux de
reclassement sur les donnees sameliore.
Il faut bien prendre garde cependant de ne pas surentraner un reseau de neurones en lui
faisant apprendre par coeur car il deviendrait alors moins performant. Il existe diverses
techniques qui permettent deviter de tomber dans le phenom`ene de sur-apprentissage
telles que la validation croisee (cross-validation), et larret precoce (early stopping) :
Larret precoce consiste `a diviser lensemble dapprentissage en deux sous-ensembles.
Le premier sous-ensemble sert `a entraner le reseau. Le deuxi`eme sous-ensemble, dit
de validation, joue le role darbitre de telle sorte que le cycle dapprentissage est
repete tant que lerreur obtenue en sortie sur les donnees de lensemble de validation
est decroissante.
La validation croisee consiste `a diviser lensemble dapprentissage en N (par exemple
5) sous-ensembles egaux et disjoints. Lapprentissage est ensuite effectue sur les
N 1 sous-ensembles et lerreur (ei ) est calculee sur le sous-ensemble restant, servant de validation. La procedure est repetee N fois, en choisissant `a chaque fois un
sous-ensemble de validation different. Enfin, un taux derreur moyen (E) est calcule et lapprentissage est refait en utilisant cette fois la totalite de lensemble de
donnees avec comme condition darret lerreur moyenne (E) calculee lors de letape
precedente (tableau 2.1)
Techniques doptimisation
Les reseaux de neurones, dans leur structure meme, permettent de nombreuses
ameliorations : choix du nombre de couches cachees, du nombre de neurones dans les
couches cachees, du type de fonctions dactivation, etc. Mais la technique la plus pertinente semble etre la combinaison de differents classifieurs pour former ce que dans la
33
Tab. 2.1 Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage est ensuite
effectue sur les N 1 sous-ensembles s2 `a S5 et lerreur est calculee sur le sous-ensemble
restant s1, servant de validation. Cette operation est reiteree quatre fois en choisissant
chaque fois un ensemble de validation different. Enfin, un taux derreur moyen est calcule
et lapprentissage est refait en utilisant la totalite de lensemble de donnees.
S
erie dapprentissage
s2 s3 s4 s5
s1 s3 s4 s5
s1 s2 s4 s5
s1 s2 s3 s5
s1 s2 s3 s4
Validation
s1
s2
s3
s4
s5
34
nale est une combinaison (vote pondere) des diverses predictions. Une troisi`eme approche
consiste `a realiser une selection ciblee (`a la place dune simple selection aleatoire) du
parametrage initial des poids des reseaux [83, 84, 85]
Enfin, les performances des reseaux de neurones peuvent etre ameliorees an appliquant
un pre-traitement des donnees, tels que lanalyse en composantes principales (ACP).
LACP sur les donnees en entree du reseau permet en effet de ne garder que les caracteristiques importantes des donnees de depart et se concretise en general par un apprentissage plus efficace du reseau de neurones [22, 86].
2.2.2
Conception, r
ealisation et
evaluation du module dinterpr
etation de lECG par r
eseaux de neurones
35
Interpr
etation des ECG par des experts humains
Chaque ECG durgence de la base de donnees de Lund a ete interprete de mani`ere
independante par un cardiologue experimente et par un medecin interne, dabord en ne
tenant compte que du seul ECG enregistre dans le service durgence, puis en tenant
compte de lECG de reference. Les ECG ont ete classes dans les categories suivantes :
1. D1 : Infarctus confirme.
2. D2 : Infarctus probable.
3. D3 : Infarctus peu probable.
4. D4 : pas dinfarctus.
Ces diagnostics ont ete etablis en nayant aucune autre information `a leur disposition que
les ECG et les dates dacquisition des deux ECG (analyse serielle).
36
M
ethodes
En situation durgence et egalement dans le cadre de lutilisation du PEM, deux situations peuvent se produire. Soit lon dispose dun ECG de reference : dans ce cas il vaut
mieux realiser une analyse serielle. Soit lon ne dispose pas dun ECG de reference car inexistant ou lon narrive pas `a le retrouver faute dun syst`eme dinformation performant :
dans ce cas il faudra se contenter dun programme danalyse unaire. Cest exactement
cette demarche que nous avons suivie en developpant deux versions du programme dinterpretation automatique des ECG toutes les deux basees sur des comites de reseaux de
neurones de type perceptron multicouches (PMC), lun de type unaire que nous tenterons
sur les enregistrements effectues en urgence, lautre de type serielle prenant en compte les
param`etres de lECG reference pour etablir le diagnostic des ECG enregistres en urgence.
La premi`ere etape a ete de constituer deux ensembles dapprentissage et de test
independants. Lensemble de test a ete forme en tirant 988 cas au hasard sur la totalite de la base de donnees de Lund (199 cas dAMI et 789 cas de controle). Lensemble
dapprentissage est compose du reste des 3703 cas (soit 703 cas dAMI et 3000 cas de
controle).
La deuxi`eme etape vise `a reduire la quantite de donnees. En effet, un programme
danalyse automatique des ECG calcule en moyenne 500 `a 1000 descripteurs. Dans notre
cas nous disposons pour chaque enregistrement : ECG de reference et ECG durgence, de
(1112)= 132 param`etres choisis pour leur pertinence eu egard `a la detection des AMI
[8]. Ils correspondant `a 11 mesures caracteristiques des ondes QRS et T sur chacune des
12 derivations : duree de QRS ; aire de QRS ; amplitudes de Q, R, et S ; et 6 mesures de
ST-T : (amplitude de ST-J, pente de ST, amplitude de ST 2/8, amplitude de ST 3/8,
amplitude de T positive et amplitude de T negative).
Pour lensemble des ECG durgence, nous effectuons une analyse en composantes principales (ACP), afin de reduire le nombre de variables. A lissue de lACP, 16 variables sont
conservees : elles correspondent `a la duree de QRS, laire de QRS, les amplitudes des ondes
Q, R et S, les amplitudes de ST et la duree de londe T. Ces 16 variables constitueront
notre premier jeu de donnees et seront utilisees pour lanalyse unaire.
Pour permettre lanalyse serielle, une nouvelle analyse en composantes principales est
effectuee sur la difference entre les 132 param`etres des ECG courants et ceux des ECG de
reference. 16 nouveaux param`etres correspondant `a levolution de la duree de QRS, laire
de QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la duree de londe
T entre ECG courants et ECG de reference, sont extraits, et, ajoutes aux 16 param`etres
decrits ci-dessus, les 32 param`etres formeront le deuxi`eme jeu de donnees.
Ces deux jeux de donnees sont ensuite utilises pour configurer deux comites de reseaux
de neurones : le premier pour les param`etres unaires et le deuxi`eme pour les param`etres
seriels. Les performances obtenues par les deux comites de reseaux de neurones sont enfin
compares par rapport aux resultats dune analyse discriminante effectuee en utilisant les
37
memes ensembles dapprentissage et de test que pour les reseaux de neurones et ceux
obtenus par linterpretation realisee par deux experts : un cardiologue experimente et
un medecin interne. Enfin, pour realiser notre mod`ele de reseaux de neurones, ainsi que
tous les tests devaluation, nous avons utilise MatlabTM et sa bote `a outils reseaux de
neurones. Lanalyse discriminante a ete realisee avec le logiciel XLSTATTM .
R
ealisation du mod`
ele de r
eseaux de neurones Plusieurs param`etres sont `a
determiner au niveau de larchitecture des reseaux : nombre de neurones sur la couche
cachee, fonctions dactivation pour le passage dune couche `a lautre, algorithme utilise
en apprentissage, etc.
Choix des fonctions dactivation Le choix de la retro-propagation pour lapprentissage du reseau impose des fonctions derivables. Les fonctions sigmodes comme
la fonction tangente-sigmode, la fonction logarithme-sigmode ou la fonction gaussienne
sont les fonctions usuellement utilisees pour les neurones des couches cachees. Dans notre
situation, nous souhaitons avoir en sortie du reseau des valeurs comprises entre 0 et 1,
o`
u un 1 correspond `a la categorie AMI et 0 signifie que le cas appartient `a lensemble
de controle. Nous avons donc choisi dutiliser des fonctions logarithme-sigmode `a la fois
pour la couche cachee et celle de sortie.
38
39
40
Tests d
evaluation - Courbes ROC
Quatre situations sont habituellement issues de levaluation dune methode de reconnaissance de formes (comites de reseaux de neurones ou analyse discriminante) dichotomique (2 classes) sur un echantillon de test. En effet, le resultat de laffectation
peut etre positif ou negatif, et la pathologie est presente (vrai) ou absente (faux). Deux
interpretations des resultats du classifieur sont correctes (vrai positif et vrai negatif).
Deux sont fausses (faux positif et faux negatif). Ces quatre situations peuvent donc etre
representees sous la forme dune matrice de confusion 2 2.
Tab. 2.2 Matrice de confusion.
R
esultats de la machine
Classement
positif
Classement
negatif
V
erit
e
Maladie presente Maladie absente
vrai positif
faux positif
a
b
faux negatif
vrai negatif
c
d
41
la performance generale de la methode `a evaluer : plus cette aire est elevee, meilleure est
la methode (Figure 2.5).
R
esultats
Evaluation de linterpr
etation des experts humains Les experts humains, cardiologue et medecin interne, ont classe les 988 ECG durgence de lensemble de test en 4
categories (D1 : infarctus confirme, D2 : probable, D3 : peu probable, D4 : pas dinfarctus) en tenant compte dans un premier temps uniquement de lECG durgence (analyse
unaire), puis en tenant compte de lECG de reference (analyse serielle).
En analyse unaire, le cardiologue a classe 86 ECG dans la categorie D1 (infarctus
confirme), 371 ECG en D2 (infarctus probable), 391 ECG en D3 (infarctus peu probable)
et 140 ECG en D4 (pas dinfarctus). Le medecin interne a classe `a son tour 32 ECG en
D1, 171 ECG en D2, 688 ECG en D3 et 97 ECG en D4.
En analyse serielle, le cardiologue a classe 80 ECG dans la categorie D1 (infarctus
confirme), 282 ECG en D2 (infarctus probable), 483 ECG en D3 (infarctus peu probable)
et 143 ECG en D4 (pas dinfarctus). Le medecin interne a classe `a son tour 41 ECG en
D1, 174 ECG en D2, 455 ECG en D3 et 318 ECG en D4.
Le tableau 2.3 illustre les resultats de lanalyse unaire des deux experts par rapport
`a la verite clinique. De la meme facon, le tableau 2.4 illustre les resultats de lanalyse
serielle des deux experts.
` partir des ces resultats, nous avons calcule 3 paires de sensibilite/specificite D1
A
(infarctus confirme) contre D2+D3+D4(infarctus probable, peu probable ou pas dinfarctus considere comme controle) ; D1+D2 (infarctus confirme ou probable considere
42
comme infarctus) contre D3+D4 (infarctus peu probable ou pas dinfarctus considere
comme controle) ; D1+D2+D3 (Infarctus confirme, probable ou peu probable considere
comme infarctus) contre D4 (pas dinfarctus considere comme controle) par analyse
(unaire/serielle), et nous avons utilise pour construire deux courbes ROC par expert
(cardiologue/interne, figures 2.8(c) et 2.8(d)).
Pour lanalyse unaire, le cardiologue realise une sensibilite de 34% et une specificite
de 97% pour D1 contre D2+D3+D4 ; 83% et 63% pour D1+D2 contre D3+D4 ; 97% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 13% et une
specificite de 99% pour D1 contre D2+D3+D4 ; 50% et 86% pour D1+D2 contre D3+D4 ;
97% et 11% pour D1+D2+D3 contre D4.
Pour lanalyse serielle, le cardiologue realise une sensibilite de 34% et une specificite
de 98% pour D1 contre D2+D3+D4 ; 78% et 73% pour D1+D2 contre D3+D4 ; 96% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 15% et une
specificite de 98% pour D1 contre D2+D3+D4 ; 56% et 87% pour D1+D2 contre D3+D4 ;
92% et 38% pour D1+D2+D3 contre D4.
Tab. 2.3 Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG durgence de lensemble de test, effectuee par les deux experts, en fonction de la verite clinique
(199 cas dinfarctus (AMI) et 789 cas de controle). Ce tableau illustre les resultats de linterpretation unaire effectuee sur les ECG durgence sans avoir eu connaissance des ECG
de reference des patients.
Cardiologue
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)
D2+D3+D4
772
130
97
D1
17
69
34
-
D3+D4
498
33
63
D1+D2
291
166
83
-
D4
135
5
17
D1+D2+D3
654
194
97
-
M
edecin interne
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)
D2+D3+D4
783
173
99
D1
6
26
13
-
D3+D4
686
99
86
D1+D2
103
100
50
-
D4
93
4
11
D1+D2+D3
696
195
97
-
Evaluation de linterpr
etation des r
eseaux de neurones et de lanalyse discriminante Dans un deuxi`eme temps, pour chacun des deux jeux de donnees :
1. 16 param`etres issus de lACP sur les ECG durgence de la base de donnees de Lund,
utilises pour faire de lanalyse unaire.
43
Tab. 2.4 Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse serielle)
Cardiologue
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)
D2+D3+D4
778
130
98
D1
11
69
34
-
D3+D4
583
43
73
D1+D2
206
156
78
-
D4
136
7
17
D1+D2+D3
653
192
96
-
M
edecin interne
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)
D2+D3+D4
779
168
98
D1
10
31
15
-
D3+D4
687
86
87
D1+D2
102
113
56
-
D4
304
14
38
D1+D2+D3
485
185
92
-
44
central limite.
1
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 2.6 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse unaire.
Enfin, les figures 2.8(a) `a 2.8(d) montrent les courbes ROC de lensemble des methodes
de diagnostic testees dans cette section : comites de reseaux de neurones, analyse discriminante, cardiologue et medecin interne, en analyse unaire et serielle.
En analyse unaire, les aires sous les courbes ROC sont respectivement de 0.861 pour
le comite de 50 reseaux de neurones, 0.753 pour lanalyse discriminante, 0.793 pour le
cardiologue et 0.713 pour le medecin interne.
En analyse serielle les performances sont sensiblement meilleures. Le comite de reseaux
de neurones affiche une aire sous la courbe ROC de 0.876, lanalyse discriminante une aire
de 0.787, le cardiologue une aire de 0.806 et le medecin interne une aire de 0.778.
Ces resultats montrent la superiorite des reseaux de neurones par rapport `a lanalyse
discriminante et linterpretation des experts humains en analyse unaire et serielle. De
meme, ils demontrent linteret de lanalyse serielle.
45
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 2.7 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse serielle.
2.2.3
Discussion
(c) Cardiologue
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.1
0.1
0.3
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
0.2
0.3
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
0.2
Sensibilit
Sensibilit
0.9
Sensibilit
Sensibilit
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.1
0.2
0.2
0.3
0.3
0.5
0.6
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
0.7
0.8
0.9
1Spcificit
0.4
Fig. 2.8 Comparaison des courbes ROC des differentes methodes en analyse unaire et
serielle.
47
de la vie du patient. Une ischemie presente `a cet instant peut tr`es bien se resorber toute
seule et ne pas provoquer une montee enzymatique ou au contraire, lECG `a ladmission peut etre tout `a fait normal et un infarctus aigu peut se developper une demi heure
apr`es. En fait, il faudrait enregistrer lECG en continu et le correler minute par minute ou
meme seconde par seconde avec des explorations quantitatives de letat du myocarde telles
que mesure continue des enzymes, imagerie continue par IRM. . . impossible `a realiser en
routine clinique.
Neanmoins, les resultats obtenus dans cette base de donnees de taille relativement importante montrent bien limportance de la variabilite inter-observateurs de linterpretation
humaine, meme en disposant dun trace de reference, et de laide au diagnostic qui doit
etre apportee, meme `a un cardiologue confirme. Comme relate recemment par Bates et
al [93], notre etude renforce de facon significative linteret dutiliser les technologies de
linformation pour ameliorer la precision diagnostique. A titre dillustration, pour une
specificite de 90%, la meilleure sensibilite de linterpretation humaine est de 52% alors
que la sensibilite de notre comite de reseaux de neurones atteint 67%, do`
u un gain de
15%.
Les perspectives doptimisation et damelioration de notre methode de classement par
reseaux de neurones sont nombreuses :
Une premi`ere piste damelioration est liee aux reseaux de neurones : optimisation
de larchitecture, du parametrage initial precedant lapprentissage, de lalgorithme
dapprentissage, de la combinaison des sorties individuelles des reseaux composants
le comite, etc.
Architecture du reseau. Il faut savoir que notre objectif etait devaluer la robustesse des reseaux de neurones. Nous avons pour cela utilise une configuration
determinee dans [22]. Cependant, un travail doptimisation doit etre fait pour
determiner larchitecture la plus adaptee `a ce type de probl`emes, cest `a dire
linterpretation automatique des ECG. Dans la litterature, de nombreux travaux de recherche ont permis de developper des methodes de reconstruction
automatique de larchitecture des reseaux de neurones moyennant des algorithmes genetiques [94].
Parametrage initial pre-apprentissage. Dans notre application, nous avons
choisi pour chaque reseau individuel un parametrage initial aleatoire des poids.
Si cette approche reste la plus simple et la plus souvent utilisee dans la
litterature, de nouvelles strategies privilegiant une selection ciblee du parametrage initial des reseaux ont commence `a prouver leur efficacite `a ameliorer
la performance des reseaux de neurones [95, 96].
Une deuxi`eme piste damelioration est liee `a lutilisation dinformations
supplementaires, en plus de lECG, tels que les donnees cliniques, lhistorique
medical, etc. de mani`ere `a etablir un diagnostic plus personnalise et plus adapte.
Cette approche est decrite dans la deuxi`eme partie de ce chapitre.
48
Conclusion
Actuellement, de nombreux travaux de recherche tentent de developper de nouvelles
approches daide `a la decision, dans le but de realiser des syst`emes intelligents qui tiennent
compte de la specificite de lutilisateur.
Le cas concret sur lequel nous avons travaille relevait du domaine de lelectrocardiologie
quantitative et de linterpretation automatique des ECG. Nous avons tout dabord propose un mod`ele original de traitement des donnees, puis nous nous sommes plus particuli`erement interesses `a la detection des ischemies. Les resultats obtenus montrent linteret
de lutilisation de comites de reseaux de neurones par rapport `a des methodes statistiques
(plus particuli`erement lanalyse discriminante). Le theor`eme central limite a montre sa
puissance : il permet daugmenter considerablement les performances des reseaux de neurones pris individuellement.
Quoiquil en soit, il nexiste certainement pas de methode universelle pour laide `a la
decision, mais il va falloir au contraire proceder par fusion de classifieurs et par fusion
de donnees en integrant davantage dinformation (donnees cliniques, historique medical,
etc.) dans le processus decisionnel.
2.3
Le syst`eme de decision embarque dans le PEM pour la detection des ischemies est
dans sa version actuelle base sur lutilisation de comites de reseaux de neurones artificiels
avec une generation dalarmes et de leur niveau prenant en consideration les scores de
risque evalues par les reseaux de neurones.
Cependant, pour obtenir un diagnostic plus precis et plus personnalise, nous avons
envisage une deuxi`eme approche qui consiste `a inclure dans le processus decisionnel une
stratification des informations cliniques du patient telles que les facteurs de risque. Le
fait dajouter une information supplementaire dans la decision finale devrait permettre
davoir une marge de securite supplementaire.
` titre dexemple, si pour un sujet sain de 45 ans sans antecedents cardiaques, le
A
module dinterpretation neuronal etablit un score diagnostic qui correspond `a une alarme
dimportance majeure, il est probable que lacquisition de lECG PEM ne se soit pas
deroulee correctement (position pendant lenregistrement, electrodes mal placees. . . ). Par
contre, si dans la famille il y a eu des antecedents dinfarctus avant 50 ans, il se pourrait
que lon soit en presence dune ischemie et il faudrait demander lavis dun cardiologue et
donc suggerer `a lutilisateur de transmettre lECG `a son medecin traitant ou `a un centre
49
de competences. Do`
u linteret de tenir compte des facteurs de risque de la personne
utilisatrice du PEM pour revoir `a la hausse ou `a la baisse le score de risque et lalarme
associee.
La figure 2.9 illustre levolution du processus decisionnel que nous preconisons de
mettre en place dans le PEM. La version actuellement embarquee dans le PEM consiste en
un module neuronal qui analyse lECG et en fonction du score de risque declenche lalarme
majeure, moyenne, mineure voire aucune alarme. La nouvelle version devrait inclure en
plus du module neuronal, un module de stratification des facteurs de risque que nous
allons decrire dans le reste de cette section. Ce module intervient apr`es linterpretation
de lECG PEM, lorsque lECG est juge comme suspect (ce qui correspond `a une alarme
moyenne ou mineure) soit pour confirmer le niveau dalarme, soit le modifier en fonction
des facteurs de risque du sujet.
Fig. 2.9 Schema synoptique du processus decisonnel embarque dans le PEM : a) sa version actuelle ; b) une future version que nous proposons avec lintroduction dun deuxi`eme
score de risque base sur le dossier medical du patient.
2.3.1
50
Choix m
ethodologiques
Approche heuristique
La premi`ere approche, qui a ete abordee dans le cadre dEPI-MEDICS, a consiste `a
concevoir un syst`eme `a base de r`egles, sous forme dalgorithmes (Figure 2.10). Ces r`egles
ont ete elaborees `a partir de directives et recommandations de comites dexperts de sante
publique en general et de cardiologie en particulier.
51
douleur typique
Age
H
30-39 69.7
40-49 87.3
50-59 92.0
60-69 94.3
dangine
F
25.8
55.2
79.4
90.6
Approche probabiliste
Lautre approche consiste `a utiliser des methodes dintelligence artificielle pour
developper des mod`eles de quantification du risque cardiovasculaire `a partir des connaissances medicales et des bases de donnees cliniques. Notre objectif est dutiliser la methode
qui pallie au mieux les probl`emes specifiques poses par notre application : prendre des
decisions basees sur des donnees incompl`etes et de natures differentes et expliquer le raisonnement en fonction des resultats. Cest pour ces raisons que nous avons choisi une
approche probabiliste basee sur lutilisation des reseaux bayesiens pour realiser notre module de facteurs de risque.
En effet, selon le type dapplication, lutilisation des reseaux bayesiens peut etre envisagee au meme titre que celle dautres mod`eles : reseaux de neurones, syst`emes experts,
arbres de decision, etc. Les aspects suivants des reseaux bayesiens les rendent, dans de
nombreux cas, preferables aux autres mod`eles :
Acquisition des connaissances : Les reseaux bayesiens donnent la possibilite de rassembler et de fusionner des connaissances de diverses natures dans un meme mod`ele.
Representation des connaissances : La representation graphique dun reseau bayesien
est explicite, intuitive et comprehensible par un nonspecialiste, ce qui facilite `a la
fois la validation du mod`ele, ses evolutions eventuelles et surtout son utilisation.
Typiquement, un decideur est beaucoup plus enclin `a sappuyer sur un mod`ele dont
il comprend le fonctionnement qu`a faire confiance `a une mod`ele Bote noire.
Utilisation des connaissances : Un reseau bayesien est polyvalent, i.e. on peut se servir du meme mod`ele pour evaluer, prevoir, diagnostiquer, ou optimiser des decisions,
ce qui contribue `a rentabiliser leffort de construction du reseau bayesien.
Enfin, linteret de lapproche des reseaux bayesiens [55] par rapport `a dautres techniques dintelligence artificielle telles que les reseaux de neurones. . . est justifie par leur
capacite `a modeliser lincertitude inherente au raisonnement medical et `a prendre des
decisions basees sur des donnees incompl`etes et de natures differentes (discr`ete, continue)
[98]. Les applications cliniques mettant en uvre lutilisation les reseaux bayesiens sont
52
2.3.2
Les r
eseaux bay
esiens
Les reseaux bayesiens [50] font partie de la famille des mod`eles graphiques qui regroupent entre autres : les mod`eles de Markov caches, les filtres de Kalman, etc. Ces
mod`eles sont le mariage entre la theorie des probabilites et celle des graphes. Dans cette
section, nous allons commencer par presenter quelques principes et concepts de base des
mod`eles graphiques. Ensuite nous allons nous focaliser sur un mod`ele particulier de la
famille des mod`eles graphiques : les reseaux bayesiens en termes de structure, param`etres
et inference.
Terminologie
Un mod`ele graphique est un outil utilise pour illustrer visuellement (theorie des
graphes) et representer de facon factorisee une distribution conjointe de probabilites sur un
ensemble de variables dun probl`eme donne (theorie des probabilites) [104]. Un graphe est
compose dune serie de nuds 1 , representant les variables et evenements du monde reel,
connectes par des aretes, representant les interactions entre les nuds, qui peuvent etre
orientees. Dans ce dernier cas, nous pouvons parler de graphe oriente (Directed Graph,
DG).
Une chane est une serie de nuds telle que chacun de ces nuds est connecte `a son
predecesseur via une arete. Un chemin est une chane telle que chaque arete est orientee
dans la meme direction que la chane. Un cycle est un chemin qui commence et se termine
au meme nud. Un chemin est dit simple si et seulement si chaque nud est visite
une seule fois. Un cycle est dit simple si, et seulement si, tous ses nuds sont uniques `a
lexception du nud de depart et de celui darrivee. Un graphe acyclique oriente (Directed
Acyclic Graph : DAG) est un graphe oriente qui na pas de cycles.
1
Dans la suite du rapport, les termes nuds et variables seront employes de facon interchangeable
53
Dans un DAG, une arete lie un nud, intitule parent, `a un autre nud, intitule enfant.
Si X1 est le parent de X2 et X2 est le parent de X3 , alors X1 est un ancetre de X3 et
X3 est `a son tour un descendant de X1 . Une famille est formee dun nud X et de ses
parents.
Une foret est un DAG tel que chaque nud a au plus un parent. Un arbre est une
foret o`
u chaque nud a un parent et un seul sauf la racine de larbre. Une corde est une
arete connectant deux nuds non-consecutifs. Un graphe triangule est un DAG o`
u tous
les cycles de longueur 3 ont forcement une corde.
Le terme complet decrit un graphe non-oriente o`
u chaque nud est connecte au reste
des nuds du graphe. Un cluster est simplement un sous-groupe de nuds dans un graphe.
Une clique est le plus grand ensemble de nuds, connectes deux `a deux : il sagit dun
sous-graphe complet.
G
en
eralit
es
Un reseau bayesien est une version particuli`ere de mod`eles graphiques representee sous
forme dun DAG dont les nuds incarnent les objets et evenements du monde reel. Les
relations cause `a effet entre les nuds sont representees par des aretes orientees du nud
cause vers le nud effet (Figure 2.11).
Chaque nud a une distribution de probabilite conditionnelle P(Xi |P arents(Xi )) qui
quantifie leffet du parent sur le nud. Une probabilite a priori est affectee aux nuds
racines (sans parents).
N
Y
P (Xi |P a(Xi ))
i=1
o`
u P a(Xi ) designe lensemble des parents du nud Xi .
(2.4)
54
P (Y |X)P (X)
P (Y )
(2.5)
Pour configurer un reseau bayesien, il est necessaire de specifier les Distributions des
Probabilites Conditionnelles (CPD) pour tous les nuds ayant des parents et la probabilite
a priori des nuds racines.
Inf
erence et arbre de jonction
Par definition, linference consiste `a calculer la probabilite de chaque etat dun nud
dans un reseau bayesien, quand dautres nuds sont observes. Plusieurs algorithmes ont
ete proposes pour realiser linference. Le plus repandu est lalgorithme de larbre de jonction [105, 106, 107].
55
Lelimination dun nud u dans un graphe non-oriente consiste `a dabord connecter tous ses nuds
voisins deux `a deux et ensuite `a supprimer le nud u et toutes les aretes connectees `a ce nud
56
le poids dun nud est defini comme le nombre detats que ce nud peut prendre
le poids dun cluster est le produit des poids de ses nuds
4
5
57
Etape
1
Ar
etes
elimin
ees
Bourse
Ar
etes
ajout
ees
-
Telecom
Electricite-Banques
Transport aerien
Electricite-Transports
4
5
Rail
Electricite
6
7
8
Transports
Banques
Service public
Cluster
induit
Banques, Service public, Transports,
Bourse*
Electricite, Banques, Service public,
Telecom*
Electricite, Transports, Rail,
Transport aerien*
Electricite, Transports, Rail
Service public, Banques, Transports,
Electricite*
Banques, Service public, Transports
Service public, Banques
Service public
Initialisation du r
eseau
Lorsque larbre de jonction est pret, letape suivante consiste `a linitialiser en affectant
des fonctions de potentiels 6 `a ses nuds comme suit :
1. pour chaque cluster et separateur, initialiser le potentiel `a 1
A 1
2. pour chaque nud u, attribuer un cluster A contenant la famille de u (u et ses
parents). Ensuite, inserer la probabilite conditionnelle P (Xu |Xpa(u) ) dans A comme
suit :
A A .P (Xu |Xpa(u) )
58
Fig. 2.15 Larbre de jonction obtenu `a partir du reseau bayesien avec les clusters retenus
du processus de triangulation (ovales) et les separateurs induits (carres).
passer le message du cluster A vers le separateur SAB , ce qui implique la mise `a
jour du potentiel du separateur
ancien S
SAB : SAB
AB
SAB A|SAB A
passer le message du separateur SAB vers le cluster B, soit :
SAB
B ancien
B
ancien
S
AB
1
0
Xu
(2.6)
59
2.3.3
Apprentissage des r
eseaux bay
esiens
Lapprentissage dun reseau bayesien doit permettre destimer les probabilites conditionnelles de chaque nud du reseau `a partir dun echantillon de donnees.
Cas de donn
ees compl`
etes
Dans le cas o`
u toutes les variables sont observees, la methode la plus simple et la plus
utilisee est lestimation statistique qui consiste `a estimer la probabilite dun evenement
par la frequence dapparition de levenement dans la base de donnees. Cette approche,
appelee maximum de vraisemblance (MV), nous donne alors :
P (Xi = xk |parent(Xi ) = cj ) = i,j,k =
Ni,j,k
k Ni,j,k
(2.7)
o`
u, Ni,j,k est le nombre devenements dans la base de donnees pour lesquels la variable
Xi est dans letat xk et ses parents sont dans la configuration cj .
Cas de donn
ees incompl`
etes
Dans les applications pratiques, les bases de donnees sont tr`es souvent incompl`etes.
Certaines variables ne sont observees que partiellement ou meme jamais. La methode
destimation de param`etres avec des donnees incompl`etes la plus couramment utilisee est
fondee sur lalgorithme iteratif EM (Expectation - Maximisation) [108, 109]. Il sagit dune
methode generale doptimisation qui peut etre appliquee dans certains cas de maximum
de vraisemblance (Maximum Likelihood) destimation des param`etres comme suit :
= arg max P(X = x|, M )
(2.8)
o`
u est un vecteur de param`etres, X est une variable aleatoire ayant x comme valeurs
observees, et M est le mod`ele (reseau bayesien,. . . ).
60
D
eroulement Lalgorithme E.M. est base sur une decomposition du probl`eme doptimisation grace `a lintroduction dune variable aleatoire z dite cachee dans le mod`ele ce
qui rend le probl`eme doptimisation analytiquement faisable.
Toutefois, au lieu dessayer de maximiser la vraisemblance des donnees observees
P (X|), nous allons maximiser la vraisemblance de la distribution jointe de X et Z =
{zi }N
esigne le nombre de classes), P (X, Z|). Nous allons utiliser le logarithme de
1 (N d
cette formule, log(P (X, Z|)). En plus, puisque nous ne pouvons pas connatre les valeurs
des variables aleatoires zi , nous utilisons lesperance (expectation) de cette quantite, soit
une distribution quelconque Q(Z). Lalgorithme E.M. consiste en deux etapes (E-step et
M-step) qui seront executees `a chaque iteration comme suit :
(2.9)
M-step Au cours de cette etape les param`etres sont mis `a jour comme suit :
k+1 = arg max Q(, k )
(2.10)
k designe la serie des valeurs des param`etres obtenues `a la k`eme iteration de lalgorithme.
Ces deux etapes seront repetees jusqu`a ce que lalgorithme converge vers un maximum : tant que |k k1 | .
2.3.4
Configuration du mod`
ele probabiliste de stratification du
risque cardiovasculaire
2.3.5
61
La base de donn
ees INDANA
Age
Type
continu
Pression arterielle systolique
continu
Pression arterielle diastolique
continu
Indice de masse corporelle
continu
Cholesterolemie totale
continu
Taux de glucose sanguin
continu
Sexe
discret
Hypertrophie ventriculaire gauche
discret
Antecedent dinfarctus de myocarde
discret
Antecedent daccident vasculaire cerebral
discret
Antecedent de diab`ete
discret
Antecedent de traitement antihypertenseur discret
Tabagisme
discret
Evenement cardiovasculaire
discret
62
2.3.6
R
ealisation du r
eseau bay
esien
Un reseau bayesien est un mod`ele probabiliste causal. En dautres termes, les variables
sont liees par un lien de cause `a effet : predecesseurs et successeurs. Pour cette raison,
le choix dune structure modelisant le probl`eme en question est crucial. Meme, si des
algorithmes dapprentissage de structures ont ete developpes, lapproche manuelle reste
la plus fiable et la plus souvent adoptee.
La structure du reseau bayesien a ete determinee de facon manuelle en se basant sur les
connaissances theoriques [9, 11, 110] et le savoir-faire des experts du domaine, notamment
avec laide du docteur Gueyffier de lHopital Cardiologique de Lyon. En effet une serie de
reunions avec le docteur Gueyffier ma permis :
Dabord detudier et analyser la base de donnees INDANA afin dextraire les variables qui pourraient servir dans lelaboration du mod`ele de stratification du risque
cardiovasculaire.
Ensuite, de determiner les influences en termes de liens de cause-`a-effet entre les
diverses variables du mod`ele.
Enfin, de tester divers configurations de reseaux bayesiens. Ces configurations sont
determinees en fonction du nombre de variables utilisees et les liens causaux entre
ces variables.
A noter que nous aurions pu adopter une des diverses approches de recueil de connaissances utilises surtout dans lelaboration des syst`emes experts et des syst`emes de gestion de bases de connaissances : les outils et methodes proposes pour aider au transfert
dexpertise (KADS [111], KOD [112],. . . voire ceux permettant dapprendre de nouvelles
connaissances `a partir dexemples [113, 114]. Mais du fait quil ne sagit que dun premier
essai pour evaluer la faisabilite dune telle approche, `a savoir les reseaux bayesiens, jai
opte pour une simple collaboration avec le cardiologue.
La figure 2.16 illustre le reseau bayesien que nous avons utilise pour stratifier les
facteurs de risque. Ce reseau prend en entree les donnees cliniques, demographiques, lhistorique medical, etc. du patient et donne une estimation du risque de la survenue dun
evenement cardiovasculaire.
Enfin, pour creer notre mod`ele de reseau bayesien, nous avons utilise le logiciel
BayesialabTM .
63
64
Fig. 2.17 Illustration de la structure individuelle des reseaux de neurones utilises pour
estimer le risque cardiovasculaire.
2.3.7
R
esultats
Les trois methodes de stratification du risque cardiovasculaire ont ete evaluees sur
lensemble de test de 5004 cas extrait de la base de donnees INDANA en comparant les
courbes ROC. Levaluation a montre une large superiorite de lapproche bayesienne, avec
une aire sous la courbe ROC de 0.80 contre 0.75 pour le comite de reseaux de neurones
et 0.74 pour le mod`ele danalyse discriminante.
2.3.8
Discussion
Le choix dun raisonnement probabiliste `a base de reseaux bayesiens est justifie pour
deux raisons :
la portabilite : le mod`ele peut etre facilement etendu `a dautres maladies cardiovasculaires. Rappelons que le PEM est `a la base configure pour detecter les arythmies
et lischemie.
la simplicite : Au del`a de lapprentissage automatique en termes de probabilites
conditionnelles et a priori des facteurs de risque, le fait quil sagit dun mod`ele
probabiliste graphique permet denvisager que le medecin traitant de lutilisateur
du PEM puisse regler les param`etres du reseau (probabilites a priori, liens causeeffet. . . ) de mani`ere `a affecter dun poids plus important un facteur de risque
specifique au patient.
2.3.9
65
Conclusion
Le mod`ele propose nest quun prototype qui permet detablir une prediction individualisee du risque cardio-vasculaire chez des patients presentant une hypertension arterielle
[115]. Cela signifie que pour une population plus large, dautres facteurs que le mod`ele
na pas pris en consideration, pourraient influencer la survenue dune maladie cardiaque.
De meme, limpact des facteurs en termes de liens cause-effet pourrait etre different. La
prochaine etape serait donc devaluer le mod`ele sur dautres bases de donnees, voire de
configurer plusieurs variantes du mod`ele qui seraient adaptees `a une serie de profils types
de lutilisateur du PEM.
2.4
Vers un mod`
ele multi-classifieurs multi-modules
du diagnostic de linfarctus : Interaction du module neuronal et du module bay
esien dans le processus d
ecisionnel global
66
67
Fig. 2.18 Proposition dun mod`ele decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun syst`eme de r`egles de logique floue.
Chapitre 3
Acquisition de lECG PEM et
synth`
ese de lECG standard
3.1
Introduction
Un des objectifs du projet EPI-MEDICS est de permettre `a lutilisateur denregistrer ses propres ECG sans la moindre assistance. Cest la raison pour laquelle le syst`eme
denregistrement ECG du PEM est base sur un nombre limite delectrodes (4), faciles `a
positionner, correspondant respectivement aux derivations peripheriques (DI, DII) et `a la
derivation precordiale V2. Ce syst`eme simplifie, pseudo-orthogonal, presente neanmoins
lavantage de recueillir la quasi-totalite de linformation spatio-temporelle de lactivite
electrique cardiaque. Or, dans le cas o`
u une situation dalarme est detectee et envoyee
par le PEM, il est necessaire de rendre lECG critique accessible par le cardiologue destinataire de lalarme, sous forme comprehensible et interpretable, `a savoir lECG 12D, qui
est, en pratique clinique, le mode de representation electrocardiologique le plus usite de
par le monde. Il est ainsi essentiel de synthetiser un ECG standard 12D `a partir de lECG
3D du PEM. Cette reconstruction doit permettre non seulement une detection precise
de lischemie, mais egalement une reproduction la plus fid`ele possible des caracteristiques
quon pourrait avoir dans lECG standard 12D si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM.
La plupart des investigations anterieures sur la synth`ese de lECG ont generalement
adopte des techniques de modelisation lineaires telles que la regression multiple. Or, ces
methodes sont tr`es sensibles `a la position des electrodes, au bruit musculaire et aux
artefacts causes par les mouvements des bras et du corps, aux interferences avec dautres
appareils,. . . Ces perturbations peuvent produire une difference significative entre les ECG
et par la suite empecher une bonne qualite de synth`ese. En outre, les methodes de synth`ese
decrites dans la litterature sont quasiment toutes basees sur des methodes dapproximation
par un mod`ele lineaire [119, 120, 121], alors que le rapport entre les signaux cardiaques
nest pas forcement un processus lineaire [122, 123].
69
A notre connaissance, seuls Scherer et al [124] ont abordes le probl`eme de la nonlinearite de la synth`ese de lECG standard 12D `a partir dun sous-ensemble de derivations
(DI, DII, V2) en proposant une technique de synth`ese lineaire par parties obtenue en divisant le signal ECG en quatre portions : le segment PR, le complexe QRS, le segment
ST-T (y compris londe T) et lintervalle TP. Pour chaque portion du signal, un mod`ele
de regression lineaire multiple calcule une matrice de transformation minimisant lerreur
quadratique moyenne (RMS) entre le signal original et le signal synthetise. Linconvenient
majeur de cette approche concerne les discontinuites introduites au niveau des extremites
de chaque segment, discontinuites qui sont amplifiees par les niveaux des lignes de bases
des derivations DI, DII et V2. Ceci rend la methode de reconstruction extremement sensible aux modifications des tensions de polarisation des electrodes et explique pourquoi
cette methode nest pas utilisee en routine clinique. Cest la raison pour laquelle jai
decide de morienter vers des techniques resolument non-lineaires basees sur des reseaux
de neurones.
Dans la suite de ce chapitre nous allons tout dabord presenter les modalites dacquisition de lECG PEM, puis une methode originale de synth`ese de lECG standard 12D `a
partir de lECG PEM 3D mettant en uvre des comites de reseaux de neurones artificiels,
Enfin nous evaluerons notre approche comparativement aux methodes traditionnelles de
la litterature.
3.2
Modalit
es dacquisition de lECG PEM
70
Fig. 3.1 Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard 12D.
objectif de favoriser lapparition, en continu ou `a intervalles programmes, danomalies qui
habituellement ne surviennent qu`a leffort (maladie des art`eres coronaires). Pour ce type
de tests, un positionnement des electrodes de facon traditionnelle (12 derivations) est
inadequat `a cause du bruit musculaire des bras et des jambes (myogramme). Or, avec le
PEM, lutilisateur est amene `a enregistrer ses propres ECG et est donc amene `a bouger.
Do`
u linteret du syst`eme de Mason-Mikar pour le positionnement des electrodes du PEM.
Cette configuration a ete concue dans le cadre du projet EPI-MEDICS avec le quadruple objectif :
1. dutiliser un nombre minimal delectrodes facile `a placer, particuli`erement dans des
conditions dutilisation `a domicile, en selfcare, en ambulatoire ou en situations
durgence ;
2. de contenir suffisamment dinformations pour diagnostiquer les ischemies et les
arythmies ;
3. de minimiser le nombre de derivations de lECG 12D `a synthetiser (autrement dit
de constituer si possible un sous-ensemble de lECG 12D standard) ;
4. doptimiser la qualite de la synth`ese des derivations manquantes de lECG 12D.
Elle est basee sur une serie detudes dans le cadre du projet EPI-MEDICS qui ont
permis de demontrer [125] quune configuration pseudo-orthogonale de derivations basee
sur DI, DII et V2 ou sur DI, DII et V3 contient suffisamment dinformations spatiotemporelles pour diagnostiquer lischemie et larythmie si la prise de decision est basee sur des
methodes danalyse multivariee ou de soft computing telles que les reseaux de neurones. Il
a ete egalement demontre au cours du projet EPI-MEDICS [126], quen prenant les coef-
71
3.3
V1
99.5
98.8
96.2
93.7
95.6
99.4
V2
99.1
98.8
93.5
88.1
91.5
-
V3
98.2
99.2
98.1
93.3
92.9
99.1
V4
97.4
97.9
99,2
98.5
96.1
97.9
V5
99.1
99.1
99.2
99.6
99.0
99.1
V6
99.6
99.6
99.6
99.4
99.4
99.6
m
98.7
99.1
99.1
97.4
94.6
95.0
99.0
Approches conventionnelles
Dans la litterature scientifique, la reconstruction de lECG 12D `a partir dun sousensemble de derivations est generalement basee sur une matrice generique de coefficients
calcules `a partir dun ensemble dECG provenant de differents patients via des techniques
statistiques telles que la regression lineaire [127, 120, 128, 121]. En outre, differentes
etudes ont conclu que la reconstruction la plus fid`ele est realisee `a laide dune matrice de
coefficients specifiques derives des ECG du patient [121, 127].
Toutefois, la plupart des methodes developpees pour la synth`ese de lECG 12D ont
ete uniquement evaluees `a laide des crit`eres de qualite classique tels que les coefficients
de correlation ou lerreur quadratique moyenne RMS (Root Mean Square Error). . . et les
enregistrements ECG 12D qui ont servi `a levaluation des resultats etaient les memes que
ceux qui ont servi pour le calcul des coefficients de synth`ese (ensembles de test identiques
aux ensembles dapprentissage). Tr`es peu detudes ont essaye devaluer levolution de la
qualite de la reconstruction de lECG dans le temps, o`
u le bruit ou les artefacts causes par
des electrodes mal placees ou les interferences avec dautres appareils. . . , sont susceptibles
de produire une difference significative entre les ECG et par la suite empecher une bonne
qualite de synth`ese. En effet, dans le meilleur des cas, la validation a ete effectuee sur
des ECG enregistres au maximum 24h apr`es le recueil des ECG sur lesquels le mod`ele de
synth`ese a ete parametre et en conservant la meme position des electrodes [119].
72
Enfin, `a notre connaissance, aucune etude na tente de realiser une evaluation plus
poussee de la qualite de la synth`ese en utilisant des descripteurs syntaxiques familiers
aux cliniciens tels que la presence ou labsence dune onde Q, le rapport de R/S. . . ou
en testant limpact de la reconstruction au niveau diagnostique et decisionnel. Il faut en
effet rappeler quen routine clinique le diagnostic electrocardiologique est base de facon
universelle sur des valeurs de param`etres damplitudes et de durees des differentes ondes
dans des combinaisons de sous-ensembles de derivations parmi les 12, en fonction des
types de pathologie. Il est donc tr`es important de pouvoir reconstruire un ECG 12D
standard `a partir de lECG PEM 3D afin que ce dernier puisse etre conserve dans le
dossier patient comme un ECG de reference si necessaire. En outre, la grande majorite
des logiciels danalyse automatique de lECG traitant lECG 12D, la reconstruction de
lECG PEM en ECG 12D autorisera son reanalyse eventuelle par dautres programmes.
3.4
Choix m
ethodologiques
Comme le PEM est prevu pour etre utilise `a grande echelle et sur le long terme
comme outil daccompagnement quotidien, il fallait tenir compte de ces contraintes en
developpant des methodes de synth`ese performantes capable de sadapter `a la variabilite
de jour en jour de lECG.
Cependant, si toutes les methodes utilisees pour la synth`ese de lECG sont basees sur
la regression lineaire, avec une qualite de synth`ese acceptable sur des ECG similaires,
aucune de ces methodes na ete evaluee sur des ECG enregistres dans des conditions
reelles avec le risque de bruit ou dartefacts. Dans de telles conditions, les methodes non
lineaires telles que les reseaux de neurones artificiels (ANN, artificial neural networks)
nous semblaient susceptibles de compenser les faiblesses des methodes lineaires. En effet,
la litterature scientifique est pleine dexemples dans dautres domaines dapplication o`
u
les approches non lineaires ont represente une alternative plus efficace que les approches
dites classiques [129, 130].
De meme, les reseaux de neurones, mis `a part leur utilisation comme classifieurs universels, grace `a leurs capacites dapprentissage, sont un outil interessant pour lapproximation de fonctions complexes. Plusieurs etudes [131, 132, 133] ont etabli que les reseaux
de neurones multicouches standards avec seulement une couche cachee sont capables dapproximer nimporte quelle fonction, si suffisamment de neurones caches sont disponibles.
Dans ce sens, les reseaux de neurones sont une classe dapproximateurs universels.
Cest pour ces raisons que jai developpe une methode originale de synth`ese de lECG
12D basee sur lutilisation des reseaux de neurones artificiels. La methode a deux versions :
une version generique et une version specifique. La version generique a pour objectif de
calculer des coefficients de synth`ese etablis `a partir de bases de donnees dECG standard
12D. Cette matrice de transformation generique peut etre integree dans le module de
synth`ese dECG du PEM lors de linitialisation de loutil.
73
Toutefois, contrairement `a la tr`es grande diversite morphologique des ECG interindividus en fonction de lage et du sexe au sein dune meme categorie diagnostique
[134], leur tr`es nette stabilite au cours du temps chez le meme sujet en labsence de nouvelles cardiopathies [135] sugg`ere de fait que la qualite de la reconstruction pourrait etre
amelioree par lutilisation dune matrice de transformation specifique `a chaque individu.
La version specifique permet ainsi dobtenir des coefficients de synth`ese personnalises `a
lutilisateur du PEM. Cela necessite de disposer dau moins un ECG standard 12D de
reference pour le patient en plus de lECG PEM afin detablir la matrice specifique du
patient. Idealement, lECG 12D de reference et lECG PEM devraient etre acquis simultanement pour saffranchir de la variabilite naturelle dun ECG `a lautre.
De plus, pour pouvoir tester la qualite de la synth`ese sur des ECG autres que ceux
qui ont servi pour lapprentissage il faut disposer, pour chaque patient, dau moins un
deuxi`eme ECG 12D standard et, dune mani`ere generale, de bases de donnees dECG
seriels. Ces bases de donnees seront decrites dans la prochaine section.
3.5
Bases de donn
ees dapprentissage et de test
Pour elaborer et valider nos methodes de synth`ese des ECG 12D, nous avons utilise
deux bases de donnees. La premi`ere est la base de donnees ECG de Lund, dej`a decrite
dans le chapitre 2. La deuxi`eme est une base de donnees composee dECG enregistres sur
des patients hospitalises au service des soins intensifs de lhopital cardiologique de Lyon
[136], identifiee durant le projet EPI-MEDICS sous le nom de la base de donnees CHDB
(Cardiology Hospital in-patients Database).
La base de donnees CHDB contient un total de 386 ECG 3D PEM et de 316
ECG 12D standard enregistres par deux techniciens `a moins dune demi-heure dintervalle entre les deux ECG. Lenregistrement est dune duree de 10 sec, avec une
frequence dechantillonnage de 500 Herz. Les ECG 12D ont ete enregistres par un
electrocardiographe numerique standard (CardietteTM ). 50 ECG standard ont ete exclus
parce quaucun ECG PEM na ete enregistre dans un intervalle de temps raisonnable. De
meme, 20 ECG PEM ont ete exclus parce quaucun ECG 12D na ete enregistre sur ces
patients pendant la meme periode. Parmi les 266 paires restantes dECG enregistres sur
les memes patients, 6 paires ont ete exclues parce que les patients avaient un stimulateur
cardiaque et 65 paires dECG ont ete exclues parce que les traces etaient de tr`es mauvaise
qualite. La population detude issue de la base de donnees CHDB consiste finalement
en une serie de 195 paires dECG recueillis sur 131 patients. 85 paires dECG ont ete
enregistrees par le premier technicien et les 110 autres paires par le deuxi`eme technicien.
Les ECG ont ete traites par le programme de Lyon [24] afin dextraire de lenregistrement de 10 sec dorigine, un complexe P-QRS-T type dune duree d1 sec representatif de
lenregistrement de 10 sec. De meme, le programme de Lyon a ete utilise pour determiner
le debut et la fin des ondes P, QRS et T.
3.6
74
Configuration du mod`
ele de synth`
ese de lECG
standard 12D par r
eseaux de neurones
3.6.1
` partir de la base de donnees de Lund, jai extrait, par selection aleatoire, un premier
A
sous-ensemble de 100 patients appele DS1. Le sous-ensemble DS1 servira `a determiner
la meilleure configuration de larchitecture des reseaux de neurones. Deux autres sousensembles de donnees, DS2 et DS3, de 100 patients chacun, seront utilises pour evaluer la
qualite de synth`ese des reseaux de neurones. Le sous-ensemble DS2, lui aussi obtenu par
tirage aleatoire, permettra de tester notre methode sur des patients selectionnes de facon
aleatoire, ce qui sous-entend quils sont susceptibles de presenter, en termes devolution,
une grande variabilite intra-patients due `a de possibles changements diagnostiques, `a des
electrodes mal placees, `a une inversion delectrodes. . . entre lECG de reference et lECG
durgence. Le sous-ensemble DS3 est constitue de 100 patients qui nont pas montre de
changements seriels significatifs sur leur 2`eme ECG suivant la methode danalyse serielle
CAVIAR [26]. Le sous-ensemble DS3 permet donc de tester notre methode de synth`ese
sur des ECG dont on a verifie quils nont pas devolution diagnostique significative ou
dinversion delectrodes.
La population detude est ainsi composee de 300 paires dECG provenant de 112
hommes et 188 femmes, avec un age moyen de 79 ans (40-96 ans), enregistres en moyenne
`a un an dintervalle (0-64 mois).
3.6.2
Nos trois sous-ensembles DS1-3 sont constitues dECG seriels enregistres en moyenne
`a un an dintervalle. Il pourrait donc y avoir de grandes differences entre les deux ECG.
Il est donc necessaire de verifier si la difference entre les ECG de reference et les ECG
75
durgence nest pas trop grande pour ne pas affecter outre mesure la qualite de la synth`ese.
On effectue donc un controle de coherence en calculant, pour chacun des 300 patients,
les coefficients de correlation entre les derivations DI, DII, V1, V2. . . V6 du premier et
deuxi`eme ECG.
3.6.3
Le probl`eme de la synth`ese des 5 derivations (V1, V3, V4, V5, V6) manquantes `a
partir du sous-ensemble des 3 derivations (DI, DII, V2) est un probl`eme dapproximation
de fonction. Or de nombreux travaux de recherche ont montre que les reseaux de neurones
[131, 132, 133], et en particulier les reseaux de type perceptron multicouches, constituent
un outil de choix pour resoudre ce probl`eme dapproximation. Deux solutions sont alors
envisageables : soit utiliser autant de reseaux que de signaux `a generer (Figure 3.2(a)),
soit dutiliser un seul reseau `a 5 sorties (Figure 3.2(b)). Notre choix sest porte vers la
solution presentee dans la figure 3.2(b). Ce choix est justifie par les raisons suivantes :
1. Sur le plan theorique : Combiner lapproximation des derivations V1, V3. . . V6 (sortie du reseau) `a partir des derivations DI, DII et V2 dans un seul et unique reseau
apporte davantage de richesse au niveau du jeu de donnees, au niveau de la combinaison de ces donnees et aura un impact positif sur la configuration des neurones
de la (des) couche(s) cachee(s). En plus, le fait quil y a une forte correlation entre
les derivations spatialement adjacentes (V1-V2, V2-V3, V3-V4,. . . ) confortee par le
fait que les cardiologues, en analysant lECG, analysent les derivations par paires
ou par triplets, justifie le choix de combiner les donnees dans un reseau global.
2. Sur la plan experimental : Une serie de tests prealables nous a permis de confirmer
le constat que le reseau global est meilleur que les 5 reseaux individuels.
Chaque reseau individuel consiste en une couche dentree de 3 neurones (un pour
chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal
derive), et h couches cachees de n neurones (Figure 3.3).
Par ailleurs, il convient de noter que la solution de la synth`ese des fonctions V1,
V3. . . V6 au moyen dun reseau multicouches est tributaire `a la fois du choix de larchitecture du reseau et de la selection initiale des poids et des biais. Larchitecture sera definie
de mani`ere experimentale au moyen dune serie de tests o`
u lon fera varier le nombre de
couches cachees (h=1, 2), le nombre de neurones par couche cachee (n=3, 5, 8, 10, 15),
et les fonctions dactivation pour les neurones des couches cachees (lineaire ou sigmode).
Concernant la couche de sortie, notre choix sest porte sur des fonctions dactivation
lineaire, `a la fois sur la base de considerations theoriques (les relations Vi = f (DI, DII, V2)
sont quasi-lineaires, les signaux sont damplitude crete `a crete variable, et peuvent etre
positifs ou negatifs), quau vu des resultats de la revue de la litterature qui indique que
les meilleurs resultats de lapproximation de fonctions au moyen de reseaux de neurones
sobtiennent generalement en utilisant des fonctions dactivation lineaire.
(a)
76
(b)
Fig. 3.2 Differents types de mod`eles de synth`ese de lECG 12D `a partir dun sousensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et 1 sortie ; (b)
reseau global avec 3 entrees, 5 sorties.
3.6.4
Processus dapprentissage et d
evaluation
Idealement, pour effectuer lapprentissage, nous aurions besoin dau moins 3 ECG
seriels par patient pour deriver un comite de reseaux de neurones specifique au patient :
un premier ECG pour effectuer lapprentissage du reseau, un deuxi`eme pour stopper
lapprentissage afin deviter le surapprentissage, et un dernier pour evaluer la capacite de
generalisation du comite. Malheureusement, les bases de donnees `a notre disposition ne
comportent pas plus de deux ECG seriels par patient. Pour surmonter cette difficulte, jai
adopte une strategie en deux temps qui consiste tout dabord `a determiner la structure
ideale des reseaux de neurones individuels et le nombre moyen diterations K sur un
ensemble dapprentissage (en fait DS1), puis `a evaluer les performances de cette structure
77
Fig. 3.3 Illustration de la structure individuelle des reseaux de neurones utilises pour
la synth`ese de lECG 12D : une couche dentree de 3 neurones (DI, DII, V2), une couche
de sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachees de n neurones.
78
ideale sur les deux ensembles de test DS2 et DS3 en stoppant lapprentissage des reseaux
de neurones specifiques au patient au bout dun nombre diterations fixe egal `a K.
1. Configuration des comites de reseaux de neurones : Comme indique ci-avant, on
utilise le sous-ensemble DS1 pour determiner la meilleure structure des reseaux du
comite et pour calculer le nombre fixe diterations K `a employer. Le processus est le
suivant : On realise, pour chaque patient de DS1 et pour chacun des N=50 reseaux
du comite de reseaux de neurones, un apprentissage sur lECG de reference du
patient. Lapprentissage est arrete lorsque la mesure derreur sur lECG de test (ECG
durgence) du patient commence `a crotre. Ce processus est repete pour chacun
des hnt structures (h=nombre de couches cachees ; n=nombre de neurones par
couche ; t=type des fonctions dactivation). La meilleure configuration est celle
qui affiche la plus faible erreur de reconstruction moyenne sur lensemble des 100
ECG test de DS1. Le nombre diterations K est determine en calculant, pour chaque
patient, la moyenne du nombre maximum des iterations pour chacun des 50 reseaux
individuels et en faisant la moyenne de ces valeurs sur les 100 patients du sousensemble DS1.
2. Verification et validation : Le but de cette deuxi`eme etape est de verifier si la
configuration des reseaux (architecture et nombre fixe diterations K) determinee
lors de letape precedente est performante sur dautres sous-ensembles dECG, en
loccurrence, DS2 et DS3. Elle consiste `a determiner, pour chaque patient, un comite
specifique de 50 ANN en utilisant les signaux de lECG de reference du patient
comme ensemble dapprentissage. La structure de chaque ANN est celle determinee
lors de letape precedente et le nombre diterations utilise pour lapprentissage est
fixe egal `a K.
Les comites de reseaux de neurones elabores sur les ECG de reference des patients de
DS2 et DS3 sont ensuite utilises pour synthetiser `a partir des signaux DI, DII et V2
des ECG de test de DS2 et DS3, les signaux V1, V3. . . V6 supposes manquants. Ces
ECG synthetises sont ensuite compares aux ECG originaux `a laide dune analyse
quantitative qui consiste `a :
(a) Calculer lerreur quadratique moyenne RMS (Root Mean Square) et le coefficient de correlation entre les derivations originales et celles synthetisees sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris).
(b) Comparer ces valeurs par rapport `a celles obtenues en utilisant un mod`ele de
regression multiple specifique du type :
Vi = ai0 + ai1 DI + ai2 DII + ai3 V 2
(3.1)
o`
u aij sont les coefficients specifiques calcules `a partir des ECG de reference.
(c) Exclure, pour chacune des 2 methodes et pour chaque derivation, 5% des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.
Cette etape est prevue pour eviter tout biais produit par les cas extremes sur
le calcul des ecarts type et des moyennes [137].
(d) Effectuer des tests statistiques (paired et trimmed paired t-tests) pour verifier si
les differences observees entre les comites de reseaux de neurones et les mod`eles
de regression multiple sont statistiquement significatives.
3.6.5
79
R
esultats
Evaluation de la variabilit
e naturelle intra-patients entre les ECG de r
ef
erence
et les ECG durgence originaux
Le tableau 3.2 illustre les valeurs des erreurs RMS entre le premier et le deuxi`eme
ECG des sous-ensembles DS1, DS2 et DS3. La valeur moyenne de lerreur RMS sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris) pour les derivations
DI, DII, V1, V2, V3, V4, V5, V6 est de 140 V pour DS1, 149 V pour DS2 et 113 V
pour DS3. Ces chiffres illustrent une variabilite intra-patients entre les ECG de reference
et les ECG durgence plus importante pour les sous-ensembles DS1 et DS2 par rapport `a
DS3, ce qui pourrait avoir un effet sur la qualite de synth`ese. Ceci sera confirme dans la
partie consacree `a levaluation quantitative.
Tab. 3.2 Erreur quadratique moyenne (RMS) en V entre les derivations DI, DII, V1,
V2, V3, V4, V5 et V6 des ECG de reference et ECG durgence des sous ensembles DS1,
DS2 et DS3, apr`es exclusion des 5 valeurs les plus extremes.
D
erivation
DI
DII
V1
V2
V3
V4
V5
V6
RMS moyenne
DS1 (N=95)
85
95
107
194
197
176
149
115
140
DS2 (N=95)
85
84
107
168
219
216
180
134
149
DS3 (N=95)
68
80
86
143
151
145
129
98
113
80
81
` noter que la performance est meilleure pour les ECG du sous(DS2) et 96% (DS3). A
ensemble DS3 par rapport `a ceux de DS1 et DS2. Cela montre quune grande partie de la
difference observee entre les derivations originales et celles synthetisees pourrait etre due
`a des electrodes mal placees ou `a un changement physiologique ou diagnostique de letat
du patient dans les sous-ensembles DS1 et DS2.
Le tableau 3.4 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 2 methodes. Dapr`es ces resultats, dans les deux approches de synth`ese,
la difference entre les reseaux de neurones et la regression multiple est statistiquement
significative (p0.001).
Tab. 3.3 Erreur quadratique moyenne (RMS) en V et coefficients de correlation (r)
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S) sur
les ECG des sous-ensembles DS1, DS2 et DS3, apr`es elimination des 5 valeurs les plus
extremes.
A
N
N
S
R
E
G
S
D
erivation
V1
V3
V4
V5
V6
V1
V3
V4
V5
V6
DS1 (N=95)
RMS
r
62
.94
91
.91
92
.88
77
.92
59
.94
64
.93
99
.91
109
.87
85
.91
61
.94
DS2 (N=95)
RMS
r
68
.93
117
.88
127
.88
104
.92
83
.91
74
.93
123
.89
148
.86
112
.91
83
.91
DS3 (N=95)
RMS
r
48
.97
80
.95
80
.96
65
.97
48
.98
55
.96
84
.94
96
.95
76
.96
52
.98
Tab. 3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de la
difference en termes derreur RMS obtenue par les comites de reseaux de neurones et les
mod`eles de regression specifiques.
Sous-ensembles
DS1 (N=95)
DS2 (N=95)
DS3 (N=95)
Pairwised t-test
< 104
< 103
< 107
Trimmed t-test
< 105
< 105
< 109
3.6.6
82
Discussion
Il est toujours difficile de comparer des resultats devaluation dune nouvelle methode
telle que la methode de synth`ese des ECG par ANN `a ceux publies dans la litterature
lorsque les bases de donnees utilisees sont differentes. Les resultats vont dependre non
seulement du type de population et des cardiopathies, mais egalement des caracteristiques
techniques de lenregistrement des ECG et des mesures utilisees pour evaluer la qualite de la synth`ese. Ainsi les valeurs RMS seront fortement tributaires de la frequence
dechantillonnage et des intervalles ECG consideres. Les coefficients de correlation seront
maximum lorsque lon ne consid`ere que londe QRS, et seront plus faible lorsque lon prend
en compte la totalite des ondes P, QRS et T. Il est donc indispensable de confronter les
resultats dune nouvelle methode par rapport `a ceux obtenus avec une methode standard
en utilisant la meme base de donnees et les memes mesures de dissimilarite. Cest ce que
nous avons fait en comparant les resultats de notre methode de synth`ese par ANN avec
ceux obtenus en mettant en uvre sur les memes donnees une methode de synth`ese par
regression multiple.
Les chiffres les plus realistes publies dans la litterature mentionnent des coefficients de
correlation medians de respectivement r=0.978 pour des traces enregistres `a t=0 sec dintervalle (ie lensemble de test est le meme que lensemble dapprentissage) et r=0.953 pour
des enregistrements realises `a 24h dintervalle sans changement de position des electrodes
(methode de regression specifique, [119]). Les chiffres que nous avons obtenus sur DS2
sont de respectivement r=0.942 pour la regression lineaire et r=0.947 pour les comites de
reseaux dANN, sachant que, `a la difference des resultats publies par Nelwan et al [119],
nos resultats ont ete obtenus sur des traces enregistres en moyenne `a 1 an dintervalle et
en considerant 1 sec de traces (soit la totalite des intervalles P, QRS, T) au lieu du seul
intervalle QT.
Quoique non comparables `a cause de la nature des ECG de notre population detude,
nous estimons que les resultats que nous avons obtenus tant en termes de coefficients de
correlation moyens que derreurs RMS nous semblent suffisamment probants pour pouvoir
dire que la methode de synth`ese par comites de reseaux de neurones specifiques surpasse
tr`es nettement la methode de synth`ese par regression specifique et meriterait detre mise
en uvre en routine clinique.
3.6.7
Conclusion
83
de plus de 800 paires dECG 12D classes soit dans la categorie apparition dun infarctus
aigue (AMI), soit dans la categorie controles extraits de la base de donnees de Lund. La
methode devaluation et les resultats sont presentes ci-apr`es en section 3.7.
Une autre etape est devaluer les potentialites de notre methode pour synthetiser
un ECG standard 12D `a partir de lECG 3D enregistre par le PEM. Cependant, pour
evaluer la qualite des synth`eses de lECG standard `a partir de lECG PEM, il faut disposer dune base de donnees regroupant `a la fois, et pour chaque patient, plusieurs paires
ECG PEM, ECG standard 12D chronologiquement homologues. Idealement chaque paire
dECG devrait etre enregistree de facon synchrone et serielle. Lacquisition des paires
dECG devrait etre effectuee `a plusieurs jours voire plusieurs mois dintervalle. Cela nous
permettrait deffectuer une evaluation, `a la fois en termes de similarite entre lECG 12D
synthetise `a partir de lECG PEM et lECG 12D original, et en termes de contenu diagnostique de lECG synthetise par rapport `a celui dorigine. Malheureusement `a ce jour,
nous ne disposons pas de telles bases de donnees. Pour circonvenir ce defaut, jai adopte
une approche alternative qui consiste en une evaluation sur un ensemble dECG de la
base de donnees CHDB.
3.7
Apr`es avoir teste dans la section precedente, `a laide de crit`eres traditionnels de qualite
(erreur quadratique moyenne RMS et coefficient de correlation), la capacite des reseaux
de neurones `a synthetiser lECG 12D `a partir dun sous-ensemble de derivations (DI, DII,
et V2), lobjectif de cette section est de presenter une evaluation de lapproche de synth`ese
par reseaux de neurones dun point de vue decisionnel en utilisant une population detude
extraite de la base de donnees de Lund et composee dECG dinfarctus et dECG de
controle. En dautres termes, il sagit dobserver limpact de la synth`ese sur linterpretation
de lECG derive par rapport `a celle obtenue sur lECG dorigine correspondant. Pour
cela, je me suis servi dun programme dinterpretation automatique developpe `a partir du
mod`ele presente dans le chapitre precedent (Figure 3.4) :
pour comparer le degre de concordance des interpretations realisees par le programme sur les ECG durgence reconstruits par rapport `a la verite clinique, i.e. la
categorie `a laquelle appartient lECG durgence dorigine,
pour mesurer la concordance entre les interpretations du programme sur les ECG
durgence reconstruits par rapport `a celles realisees sur les ECG durgence dorigine.
Dans le reste de cette section, nous allons dabord presenter les ensembles dapprentissage et de test que nous avons construit pour evaluer la methode de synth`ese par reseaux
de neurones. Ensuite, nous allons presenter les protocoles devaluation et enfin les resultats
des evaluations effectuees par rapport `a la regression multiple.
84
3.7.1
3.7.2
85
Pour synthetiser les derivations (V1, V3, V4, V5, V6) `a partir du sous-ensemble de
derivations (DI, DII, V2), jai utilise comme precedemment des comites de 50 reseaux de
neurones artificiels. Larchitecture de chaque reseau individuel, lalgorithme dapprentissage ainsi que le nombre diterations sont ceux decrits dans la section 3.6.
Pour chacun des 808 patients de la population detude, un comite de reseaux de neurones specifique au patient est calcule. Lapprentissage des reseaux est effectue sur lECG
de reference avec un nombre diterations fixe pour eviter le sur-apprentissage. LECG
durgence va ensuite servir pour evaluer la capacite de generalisation du comite.
3.7.3
86
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 3.5 Courbes ROC resultant de la comparaison entre la classification des ECG
derives par reseaux de neurones et par regression, par rapport `a la verite clinique des
ECG originaux correspondants.
0.862 pour les ECG synthetises par reseaux de neurones et 0.854 pour ceux synthetises
par regression. Ces resultats sont remarquablement eleves car `a peine inferieurs `a ceux
obtenus sur les ECG originaux (aire de 0.872), avec un net avantage de la methode de
synth`ese par reseaux de neurones par rapport `a la regression.
87
meilleure concordance dinterpretation entre ECG originaux et synthetises par rapport `a la performance realisee par la methode de regression.
2. Tous les elements de la matrice de confusion, en dehors de la tridiagonale, sont nuls
ce qui signifie que les interpretations entre lECG original et les ECG de synth`ese ne
different au maximum que de un degre dans lestimation de la qualite de lischemie,
et donc quil ny a pas de discordance sev`ere entre les interpretations. Le fait que
le diagnostic puisse passer dune categorie `a la categorie adjacente est dautant plus
probable que la sortie des ANN est proche des seuils de decision.
Tab. 3.5 Concordance entre les interpretations des ECG originaux et les interpretations
des ECG synthetises par reseaux de neurones (ANN-S) et par regression (REG-S). Le
logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de risque, risque
mineur, moyen et majeur.
Original
ANN-S
pas de risque (374)
risque mineur (209)
risque moyen (119)
risque majeur (106)
REG-S
pas de risque (379)
risque mineur (212)
risque moyen (113)
risque majeur (104)
3.7.4
pas de risque
(383)
risque mineur
(219)
risque moyen
(110)
risque majeur
(96)
351
32
0
0
22
160
36
1
1
17
76
16
0
0
7
89
350
32
1
0
29
158
32
0
0
22
73
15
0
0
7
89
3.8
3.8.1
88
Evaluation de la qualit
e de la synth`
ese des ECG
standards 12D `
a partir des ECG 3D du PEM
Objectifs
Si linteret de notre approche de synth`ese dECG par reseaux de neurones est dej`a
prouve, letape logique suivante est devaluer la performance de la methode sur les ECG
3D du PEM enregistres `a plusieurs jours dintervalle, tenant compte des conditions dacquisition des ECG et dun minimum de variabilite de jour en jour de lECG. Rappelons
que le syst`eme dacquisition de lECG du PEM est base sur le positionnement de MasonLikar des derivations peripheriques DI et DII, et sur la derivation precordiale V2, et que
lutilisateur est amene `a enregistrer ses propres ECG et est donc amene `a bouger.
Levaluation de la qualite de la synth`ese de lECG standard 12D `a partir de lECG
PEM 3D sera effectuee sur un sous-ensemble dECG 12D et PEM 3D de la base de
donnees CHDB que nous decrirons dans la section suivante. Cette evaluation va consister
tout dabord `a utiliser des crit`eres traditionnels de qualite (erreur quadratique moyenne
RMS et coefficient de correlation) pour mesurer la capacite des reseaux de neurones `a
synthetiser lECG 12D `a partir dun sous-ensemble de derivations (DI, DII, et V2) du
PEM. Toutefois, la mise en uvre de cette approche nest pas simple. En effet, pour pallier
aux contraintes liees `a lutilisation de deux appareils differents (PEM pour les ECG 3D et
Cardiette pour les ECG 12D) pour enregistrer les ECG et au fait que lenregistrement des
deux ECG (12D et 3D) nest pas synchronise, il est indispensable de recourir dabord `a un
procede dalignement des signaux avant de pouvoir effectuer des mesures des differences
entre les derivations reconstruites et celles de reference. Ensuite, nous effectuons une
evaluation dun point de vue diagnostic pour tester limpact de la synth`ese sur la qualite
de linterpretation. Ceci sera realise en mesurant la concordance entre les interpretations
elaborees par le programme dinterpretation automatique, developpe dans le chapitre 2,
sur les ECG 12D reconstruits `a partir des ECG PEM 3D, et les interpretations realisees
sur les ECG Cardiette dorigine. Ces derni`eres sont considerees comme etant la verite.
De plus, par rapport aux sections precedentes, nous presenterons deux versions de
la methode de synth`ese : une version generique ayant pour objectif de calculer des coefficients de synth`ese etablis `a partir dun ensemble dECG standard 12D, ainsi quune
version specifique permettant dobtenir des coefficients de synth`ese personnalises `a lutilisateur du PEM `a partir de ses propres ECG. En effet, lors de la premi`ere utilisation du
PEM, il est probable que lon ne dispose pas encore de transformation specifique, et il est
donc important de savoir sil faut plutot utiliser une matrice de transformation generique
obtenue par regression multiple ou une methode de synth`ese basee sur des comites de
reseaux de neurones.
3.8.2
89
Population d
etude
Pour constituer notre population detude, nous avons extrait de la base de donnees
CHDB une serie de paires dECG en appliquant un ensemble de r`egles decrites ci-apr`es.
Rappelons, en preambule, que la base de donnees CHDB contient, apr`es un premier
controle de qualite et de coherence, 195 paires dECG provenant de 131 patients. Chaque
patient poss`ede une, deux, voire plusieurs paires dECGs (Tableau 3.6). Chacune des
paires consiste en un ECG standard 12D et en un ECG PEM 3D base sur les derivations
DI, DII et V2.
Tab. 3.6 Description de la base de donnees CHDB.
195 paires dECG (3D et 12D) pour 131 patients
Nb de patients
Nb de paires par patient
83
1
36
2
9
3
2
4
1
5
Contr
ole de qualit
e et de coh
erence
Interpr
etation des ECG par des experts humains Chaque ECG 12D de la base de
donnees CHDB a ete interprete de mani`ere independante par un cardiologue experimente.
Chaque ECG a ete classe dans lune des deux categories suivantes :
1. ACS (Acute Coronary Syndrome), si un syndrome coronarien aigu (ACS) a ete
diagnostique sur lECG.
2. Controle, si lECG enregistre provenait dun patient pour lequel le diagnostic etait
autre que ACS.
Les 195 ECG standard 12D ont ete classes en respectivement 60 cas diagnostiques
ACS et 128 cas de controle. Les 7 cas restants nont pu etre diagnostique et ont
donc ete elimines de notre base de donnees.
A lissue de cette etape, notre ensemble de donnees est forme de 188 paires dECG provenant de 130 patients se repartissant ainsi :
1. 83 patients ont 1 paire dECG,
2. 39 patients ont 2 paires dECG,
3. 5 patients ont 3 paires dECG,
4. et 3 patients ont 4 paires dECG.
90
Nous avons donc subdivise la base CHDB en deux sous-ensembles : SE1 est forme des
83 patients de la population detude ayant une seule paire dECG PEM 3D et Cardiette
12D et SE2 est forme des 47 patients ayant au moins deux paires dECG PEM et Cardiette.
Pour les 8 patients du sous-ensemble SE2 ayant plus de deux paires dECG, nous navons
retenu que les deux premi`eres paires dECG 3D et 12D `a condition quelles aient ete
enregistrees `a au moins 1 jour dintervalle. SE2 est donc constitue de 472 paires dECG
provenant de 47 patients. Les 94 paires dECG standard et les 94 paires dECG PEM ont
ete enregistres en moyenne `a 3 (1-21) jours dintervalle.
Processus de contr
ole de la coh
erence entre les ECG PEM et les ECG 12D
standards Du fait que lenregistrement des ECG nest pas synchrone et en raison du
statut cardiaque tr`es evolutif typique des patients dans un service de soins intensifs, il
pourrait y avoir de grandes differences entre les deux ECG PEM et 12D, souvent acquis `a
quelques dizaines de minutes dintervalle, et plus encore pour les cas de SE2, o`
u les deux
paires dECG ont ete enregistrees jusqu`a 3 jours dintervalle. Ces differences pourraient
affecter de mani`ere considerable la mesure des ecarts entre les ECG de synth`ese et les
ECG 12D dorigine, surtout en cas dapparition de troubles de la conduction ou du fait
de levolution dune ischemie aigue. Les differences imputables `a levolution de letat cardiaque pourraient en effet etre beaucoup plus importantes que celles dues aux algorithmes
de reconstruction des derivations manquantes.
Lobjectif de cette etape est donc de verifier si la difference entre les ECG PEM et Cardiette nest pas trop grande et deliminer les paires denregistrements dont les differences
depassent un certain seuil, pour eviter de fausser les mesures de la qualite de la synth`ese.
Le controle de coherence est effectue comme suit : pour chacun des 47 patients du sousensemble SE2, une analyse de correlation est effectuee entre les derivations DI, DII, V1,
V2. . . V6 du premier et deuxi`eme ECG Cardiette et entre les derivations DI, DII et V2
du premier ECG Cardiette et du deuxi`eme ECG PEM. Enfin, une troisi`eme et derni`ere
analyse de correlation est effectuee entre les derivations DI, DII et V2 du deuxi`eme ECG
Cardiette et de lECG PEM associe. Les traces sont juges coherents si aucun des coefficients de correlation entre deux derivations chronologiquement homologues nest inferieur
`a 0.2, seuil etabli de facon experimentale sur la base de donnees etudiee. A la suite de
cette etape, 10 patients ont ete elimines du sous-ensemble SE2. Lensemble de donnees
final consiste donc en une serie de (83+37) 157 paires dECG collectees sur 120 patients
(82 hommes, 38 femmes ; moyenne dage ecart type = 61 15 ans). Un syndrome coronarien aigu (ACS) a ete diagnostique sur 46 (29%) des 157 ECG standard 12D : (SE1 :
21 ECG ACS et 62 ECG de controle et SE2 : 25 ECG ACS et 49 ECG de controle).
3.8.3
Pr
etraitement des ECG
Pour aligner les traces ECG issus du PEM et des electrocardiographes 12D, nous avons
tout dabord aligne les debuts des QRS (determines par le programme de Lyon) des deux
91
traces puis nous avons evalue, au moyen dun algorithme de correlation croisee (cross
correlation) [139] le decalage entre les deux enregistrements en analysant les segments
allant du debut de londe Q jusqu`a la fin de londe T (QT) des derivations V2 des deux
signaux comme suit (Figure 3.6) :
Calcul de la correlation croisee dans lintervalle QT.
Estimation du decalage entre les deux signaux par la localisation de la valeur maximale de la fonction de correlation.
Utilisation du decalage calcule par correlation croisee pour aligner toutes les
derivations des ECG PEM et Cardiette.
3.8.4
Pour synthetiser les derivations (V1, V3, V4, V5, V6) `a partir du sous-ensemble
de derivations (DI, DII, V2) enregistrees par le PEM, nous avons utilise comme
precedemment un ensemble de comites de 50 reseaux de neurones artificiels constitues
de perceptrons multi-couches (PMC). Lapprentissage des PMC est effectue `a laide dun
algorithme de retropropagation supervisee (scaled conjugate gradient algorithm, SCG).
Chaque reseau consiste en une couche dentree de 3 neurones (un pour chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal derive), et 1 couche
cachee de 15 neurones. En dautres termes, il sagit de la meme configuration que celle que
nous avions obtenue lors de levaluation sur la base de donnees de Lund dans les sections
precedentes.
3.8.5
Processus dapprentissage
g
en
eriques
des
r
eseaux
de
neurones
Pour palier au fait que nous ne disposions que dun nombre restreint dECG standard
12D (83 ECG), nous avons adopte un processus dapprentissage du comite de reseaux
de neurones generiques mettant en uvre une technique de validation croisee (crossvalidation), dej`a expliquee dans le chapitre 2, comme suit : lensemble des 83 ECG 12D de
SE1 est divise en M=10 sous-ensembles egaux et disjoints. Ensuite, pour I = 1 `a M, chaque
reseau individuel du comite realise un apprentissage sur les M 1 sous-ensembles restant et
lerreur est calculee sur le sous-ensemble I, servant de validation. Les ECG des M 1 sousensembles sont juxtaposes pour former un enregistrement ECG artificiel continu. Larret
de lapprentissage est realise en surveillant lerreur de reconstruction (erreur quadratique
moyenne, RMS) sur le sous-ensemble restant I, o`
u les ECG ont ete egalement juxtaposes
pour former un enregistrement ECG continu. Le cycle dapprentissage est repete tant que
lerreur obtenue en sortie sur les donnees de lensemble de validation I est decroissante.
La procedure est repetee N fois pour chacun des reseaux du comite. Un nombre fixe
diterations K est alors determine en memorisant pour chacun des MN apprentissages le
nombre diterations et en calculant la moyenne de ces valeurs. Enfin, lapprentissage des
Fig. 3.6 Illustration de lalignement des signaux ECG par correlation croisee.
92
93
N=50 PMC est refait en utilisant la totalite de lensemble de donnees SE1 et en prenant
comme crit`ere darret le nombre fixe diterations calcule lors de letape precedente (Figure
3.7).
3.8.6
Processus dapprentissage
sp
ecifiques
des
r
eseaux
de
neurones
Comme dej`a indique plus haut, lideal serait davoir au moins 3 ECG seriels par patient
pour realiser un apprentissage specifique au patient. Or avec SE2, nous ne disposons au
maximum que de 2 enregistrements seriels par patient. Pour compenser ce manque de
donnees, nous avons adopte la meme strategie que pour la base de donnees de Lund
en utilisant comme crit`ere darret de lapprentissage un nombre fixe diterations K. En
pratique nous avons retenu la valeur de K que nous avons calcule sur les 83 ECG 12D de
SE1, soit K=56. Pour chacun des 37 patients du sous-ensemble SE2, nous avons configure
un comite de reseaux de neurones specifiques. Lapprentissage de chacun des N=50 reseaux
du comite est effectue sur le premier ECG 12D. Cet apprentissage est conditionne par le
nombre fixe diterations K.
3.8.7
V
erification et validation de la synth`
ese de lECG 12D
94
95
Fig. 3.8 Visualisation des intervalles de temps utilises pour lapprentissage des comites
de reseaux de neurones generiques et specifiques (PT : P-Onset -18 `a T-offset +38 msec)
et pour tester leur capacite de generalisation (QT : Q-onset -18 `a T-offset +38 msec). En
cas dabsence de londe P, on remplace le pointeur P-onset par un pointeur virtuel tel que
lintervalle PQ correspondant `a lintervalle PQ moyen.
2. Evaluation diagnostique : lexactitude de la reconstruction de lECG 12D est evaluee
au niveau diagnostique en mesurant le degre de concordance entre les resultats
de linterpretation automatisee de lECG de reference et ceux obtenus sur lECG
synthetise. Cette interpretation est realisee de la meme facon que pour la base de
donnees de Lund en utilisant le programme de diagnostic developpe dans le chapitre
2 pour classer respectivement les ECG derives par voie generique et ceux generes
par voie specifique `a laide des comites de reseaux de neurones et des mod`eles de
regression multiple. Nous comparons ensuite les interpretations des ECG synthetises
au moyen des mod`eles de transformations generiques et specifiques aux resultats
de la stratification en deux groupes (controle et infarctus) des ECG de reference,
realisee par le meme programme que ci-dessus, resultat qui sera considere comme
etant la verite. La meilleure methode de synth`ese est celle qui fournit la meilleure
concordance.
3.8.8
R
esultats
Evaluation de la variabilit
e inter-patients naturelle des ECG
Le tableau 3.7 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier et le deuxi`eme ECG standards de SE2 enregistres `a 3 jours dintervalle
en moyenne en unite de soins coronariens. La valeur moyenne de lerreur RMS dans
lintervalle QT (Q-onset -18 `a T-offset +38 msec) pour les derivations DI, DII, V1, V2,
96
V3, V4, V5, V6 est de 106 V. Le coefficient de correlation est 0.92 en moyenne.
Les deux tableaux suivants presentent les resultats entre chacun de ces ECG Cardiette
et le deuxi`eme ECG PEM, afin dobserver une double confrontation.
Le tableau 3.8 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier ECG Cardiette et le deuxi`eme ECG PEM. La valeur moyenne de lerreur
RMS dans lintervalle QT pour les derivations DI, DII et V2 est de 107 V. Le coefficient
de correlation est de 0.87 en moyenne.
Enfin, le tableau 3.9 illustre les valeurs des erreurs RMS et des coefficients de
correlation entre le deuxi`eme ECG Cardiette et lECG PEM associe. La valeur moyenne
de lerreur RMS au niveau de lintervalle QT pour les derivations DI, DII et V2 est de 80
V. Le coefficient de correlation est 0.93 en moyenne.
Tab. 3.7 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre
les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxi`eme ECG
Cardiette du sous ensemble SE2, apr`es elimination des 5% des cas les plus extremes
(N=35).
Cardiette 1 vs Cardiette 2
D
erivation RMS ()
r ()
DI
60 ( 30)
.93 () 0.09
DII
73 ( 32)
.85 () 0.18
V2
125 ( 58) .95 () 0.07
V1
V3
V4
V5
V6
82 ( 44)
135 ( 57)
136 ( 56)
139 ( 59)
100 ( 41)
.95
.95
.92
.90
.91
()
()
()
()
()
0.08
0.04
0.08
0.13
0.10
97
Ces resultats illustrent tout dabord la variabilite de jour en jour de lECG standard
12D (Cardiette 1 vs Cardiette 2). Cette variabilite est accentuee avec lintroduction du
positionnement Mason-Likar pour lECG PEM sur les derivations DI et DII (Cardiette
1 vs PEM 2). Ce double effet va avoir des consequences importantes sur la qualite de la
synth`ese de lECG standard.
Evaluation quantitative
D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII, V2)
de lECG Cardiette Les resultats de levaluation quantitative en termes derreur RMS
et coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees `a
partir de (DI, DII, V2) de lECG Cardiette 2 de SE2 en utilisant tour `a tour le comite de
reseaux de neurones et le mod`ele de regression generiques deduits `a partir des ECG 12D
de SE1 sont illustres dans le tableau 3.10. Ces resultats montrent une leg`ere superiorite de
la synth`ese des ECG par reseaux de neurones, avec une RMS moyenne de 122 V dans le
segment QT versus une RMS moyenne de 126 V pour la regression generique. Au niveau
de la correlation entre les derivations synthetisees et les derivations originales, les deux
methodes affichent une performance `a peu pr`es similaire avec une correlation moyenne de
0.93.
Levaluation quantitative des comites de reseaux de neurones et des mod`eles de
regression specifiques est illustree dans le tableau 3.11. Ces resultats montrent une assez
nette superiorite de la synth`ese dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 94 V dans lintervalle QT, par rapport `a la regression specifique avec une
RMS moyenne de 108 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese par reseaux de neurones specifiques affiche des
correlations superieures `a celles de la regression specifique avec des correlations moyennes
de respectivement 0.96 et 0.95 dans lintervalle QT.
Le tableau 3.12 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 4 methodes. Dapr`es ces resultats, seule lapproche de synth`ese specifique
98
V2 Cardiette
r ()
.97 () 0.02
.97 () 0.03
.88 () 0.14
.91 () 0.09
.93 () 0.07
.97 () 0.02
.96 () 0.04
.88 () 0.09
.90 () 0.07
.92 () 0.08
V5
112 ( 42)
.95 () 0.04
S
V6
84 ( 34)
.95 () 0.04
R
V1
75 ( 33)
.98 () 0.02
E
V3
99 ( 46)
.97 () 0.02
G
V4
140 ( 55)
.92 () 0.07
V5
132 ( 46)
.93 () 0.05
S
V6
93 ( 40)
.94 () 0.06
5
* p 0.01, ** p 10 (paired t-tests)
99
affiche une difference statistiquement significative (p< 106 ) entre les reseaux de neurones
et la regression multiple.
Tab. 3.12 Comparaison par les t-tests (pairwised et trimmed) de la difference en termes
derreurs RMS obtenues par les comites de reseaux de neurones et les mod`eles de regression
generiques et specifiques (N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S
0.236
< 106
0.066
< 107
D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII, V2)
de lECG PEM Les resultats de levaluation quantitative en termes derreur RMS et
coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees `a partir
de (DI, DII, V2) de lECG PEM 2 au moyen du comite de reseaux de neurones generique
et du mod`ele de regression generique derives comme precedemment `a partir des ECG
Cardiette de SE1, sont illustres dans le tableau 3.13. Ces resultats montrent une leg`ere
superiorite de la synth`ese dECG par reseaux de neurones generiques, avec une RMS
moyenne de 131 V dans lintervalle QT, par rapport la regression generique avec une
RMS moyenne de 134 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese dECG par reseaux de neurones generiques affiche
une superiorite plus nette avec une correlation moyenne de 0.92 dans lintervalle QT, par
rapport `a la regression generique avec une correlation moyenne de 0.90.
Levaluation quantitative des comites de reseaux de neurones specifiques et des mod`eles
de regression specifiques est illustree dans le tableau 3.14. Ces resultats montrent la
superiorite de la synth`ese dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 118 V dans lintervalle QT, par rapport la regression specifique avec une
RMS moyenne de 126 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese par reseaux de neurones specifiques affiche une
correlation superieure `a celle de la regression specifique avec une correlation moyenne de
respectivement 0.93 et 0.92 dans lintervalle QT.
Le tableau 3.15 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 4 methodes. Dapr`es ces resultats, seule lapproche de synth`ese specifique
affiche une difference statistiquement significative (p< 0.05) entre les reseaux de neurones
et la regression multiple.
La qualite de la synth`ese affichee par notre approche de comites de reseaux de neurones ne semble pas etre globalement tr`es superieure `a celle de lapproche traditionnelle
de regression lineaire, en particulier au niveau generique. Cependant, vu le fait que dans
notre etude les ECG sont enregistres suivant deux syst`emes dacquisition differents :
100
A
V1
108 ( 49) .96 () 0.03
N
V3
120 ( 59) .96 () 0.03
N
V4
169 ( 72) .88 () 0.14
V5
156 ( 66) .89 () 0.09
G
V6
104 ( 40) .90 () 0.09
R
V1
113 ( 51) .95 () 0.03
E
V3
121 ( 62) .96 () 0.04
G
V4
172 ( 67) .88 () 0.11
V5
157 ( 64) .88 () 0.09
G
V6
105 ( 43) .89 () 0.09
* p 0.05 (paired t-test)
A
V1
90 ( 35)
.95 () 0.04
N
V3
120 ( 61) .97 () 0.02
N
V4
147 ( 69) .91 () 0.09
V5
132 ( 53) .92 () 0.05
S
V6
99 ( 43)
.91 () 0.09
R
V1
102 ( 42) .94 () 0.05
E
V3
110 ( 50) .96 () 0.03
G
V4
164 ( 72) .89 () 0.10
V5
150 ( 58) .90 () 0.07
S
V6
103 ( 47) .90 () 0.10
* p 0.01 (paired t-test)
101
positionnement standard pour lECG 12D et positionnement Mason Likar pour lECG
PEM et lintroduction dun dephasage d
u `a lasynchronisme existant entre les horloges
dechantillonnage des dispositifs denregistrement PEM et Cardiette, la difference devient
plus evidente. En effet, ces contraintes ont genere une difference moyenne en termes derreur RMS de 76 V et une correlation moyenne de 0.90 entre les derivations originales
DI et DII des ECG 12D et ECG 3D chronologiquement homologues (tableau 3.9). Leffet
Mason-Likar sur DI est plus important que la variabilite de jour en jour de lECG standard 12D (tableau 3.7). Par ailleurs, il convient de remarquer que les valeurs RMS et les
correlations des derivations V1, V3. . . V6 synthetisees par les comites ANN-S `a partir des
traces PEM 2 sont tout `a fait comparables `a celles mesurees entre les traces Cardiette
1 et Cardiette 2 (tableau 3.7). On peut donc penser que lon pourrait encore ameliorer
les resultats si lon construisait des reseaux specifiques sur des ECG 12D enregistres en
position Mason-Likar.
Tab. 3.15 Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la
difference en termes derreurs RMS obtenues par les comites de reseaux de neurones et
les mod`eles de regression generiques et specifiques lorsque les entrees sont des ECG PEM
(N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S
0.193
< 0.05
0.164
< 0.03
102
(a)
(b)
Fig. 3.9 Incidence de la methode de synth`ese de lECG sur la calcul des param`etres
ECG de type syntaxique. A gauche sur lECG dorigine, le trace presente une petite onde
R et une grande onde S. A droite, sur lECG de synth`ese, aspect typique dit QS. Londe
R, microvoltee, na pas ete detectee et par consequent la duree de londe Q est passee de
0 `a 92 msec et celle de londe S de 70 msec `a 0.
D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII,
V2) de lECG PEM 2 Le tableau 3.18 illustre le degre de concordance entre les
interpretations automatiques des ECG Cardiette 2 Originaux et celles des ECG 12D
synthetises `a partir des derivations DI, DII et V2 de lECG PEM chronologiquement
homologue (ECG PEM 2) par le comite de reseaux de neurones generiques et le mod`ele
de regression multiple generique, linterpretation des ECG Cardiette 2 etant consideree
comme etant la verite. De meme, le tableau 3.19 illustre le degre de concordance entre
les interpretations automatiques des ECG Cardiette 2 originaux et celles des ECG 12D
synthetises par les comites de reseaux de neurones specifiques et les mod`eles de regression
103
Tab. 3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises `a partir des derivations DI, DII et V2 de lECG 12D Cardiette 2 par le comite
de reseaux de neurones generiques (ANN-G) et par le mod`ele de regression generique
(REG-G). Le logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de
risque, risque mineur, moyen et majeur.
Original
ANN-G
pas de risque (8)
risque mineur (14)
risque moyen (6)
risque majeur (9)
REG-G
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
6
0
0
0
2
13
0
0
0
0
4
1
0
1
2
8
5
1
0
0
2
13
0
0
0
0
4
1
0
1
1
9
Tab. 3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S).
Original
ANN-S
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)
REG-S
pas de risque (6)
risque mineur (16)
risque moyen (5)
risque majeur (10)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
5
1
0
0
2
13
0
0
0
0
4
1
0
1
1
9
5
1
0
0
1
14
0
0
0
1
3
1
0
0
2
9
104
multiple specifiques.
Tab. 3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits `a
partir des derivations DI, DII et V2 de lECG PEM 2.
Original
ANN-G
pas de risque (5)
risque mineur (12)
risque moyen (13)
risque majeur (7)
REG-G
pas de risque (6)
risque mineur (13)
risque moyen (10)
risque majeur (8)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
3
2
1
0
1
8
6
0
1
1
2
1
0
1
4
6
3
2
1
0
2
9
4
0
1
1
2
1
0
1
3
7
Bien que moins probants, ces resultats sont neanmoins satisfaisants car 34 cas sur
37 cas se retrouvent ici encore sur la tridiagonale de la matrice de confusion. Deux cas
supplementaires montrent un changement de categorie diagnostique qui va au del`a de la
categorie adjacente. Ainsi un cas passe de la categorie pas de risque `a la categorie risque
moyen, un autre passe de la categorie risque moyen `a la categorie pas de risque.
Comme pour levaluation quantitative, le fait davoir utilise des ECG enregistres `a
plusieurs minutes dintervalle avec deux syst`emes dacquisition differents, ie un positionnement des electrodes DI et DII standard pour lECG 12D et Mason Likar pour lECG
PEM 3D, parfois des electrodes mal-placees. . . a pu generer des differences importantes
entre les derivations originales DI et DII des ECG 12D et ECG 3D. Cette variabilite, tr`es
importante dans certains cas, a empeche une bonne qualite de synth`ese et a d
u alterer
le contenu diagnostique des ECG. Si lon prend comme crit`ere de qualite le pourcentage
de diagnostics sans changements de categorie (ie la somme des elements de la diagonale
des matrices de confusion divisee par le nombre total de cas analyses, soit 37), ANN-S
semble plus performant que REG-S, mais pas plus performant que ANN-G. De facon surprenante, la regression generique (REG-G) avec 21/37 classes `a lidentique, semble etre
la methode la plus performante. Ces resultats sont cependant `a prendre avec precaution
car avec seulement 37 cas, lensemble de test nest pas suffisamment representatif pour en
tirer des conclusions definitives.
105
Tab. 3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits `a
partir des derivations DI, DII et V2 de lECG PEM 2.
Original
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
4
1
1
0
2
6
7
0
1
1
2
1
0
1
3
7
4
1
1
0
3
4
8
0
1
1
2
1
0
1
3
7
ANN-S
pas de risque (7)
risque mineur (9)
risque moyen (13)
risque majeur (8)
REG-S
pas de risque (8)
risque mineur (7)
risque moyen (14)
risque majeur (8)
3.9
Discussion
3.10
106
Conclusion
Dans ce chapitre, nous avons presente letude exhaustive dune methode originale
de synth`ese de lECG 12D par application de comites de reseaux de neurones artificiels
que jai developpe au cours de ma th`ese. Les evaluations quantitatives et cliniques de la
methode ont demontre son interet majeur dans le cadre dun scenario de telemedecine :
acquisition dun ECG simplifie `a domicile ou en ambulatoire, et generation de lECG
standard 12D correspondant.
Les performances enregistrees par la methode de reseaux de neurones sur des ECG
12D seriels ou des ECG 12D et ECG PEM enregistres dans des conditions simulant celles
dutilisation du PEM (cest `a dire en ambulatoire ou `a domicile, acquisition par le patient,
son entourage ou un/une aide soignant(e), avec un positionnement delectrodes different
de celui de lECG standard 12D), ont largement depasse les methodes conventionnelles
publiees dans la litterature. Les premiers resultats des experimentations de la methode
de synth`ese ont ete presentes lors de la conference internationale IEEE Computers in
Cardiology 2004 [140]. Un deuxi`eme article, sur levaluation sur la base de donnees CHDB,
a ete soumis pour publication `a la revue internationale Methods of Information in Medicine
[141], et un troisi`eme article est en cours de redaction.
107
V1
V3
V4
V5
V6
REG G
REG S
Original
ANN S
ANN G
Fig. 3.10 Illustration de la qualite de synth`ese de lECG standard 12D `a partir de lECG
PEM 3D.
Chapitre 4
Mise en place de la plateforme
d
ecisionnelle du PEM
4.1
Objectifs
Dans ce chapitre, nous allons principalement exposer et traiter les probl`emes liees au
deploiement des methodes dintelligence artificielle abordees dans les precedents chapitres,
dans la plateforme logicielle du syst`eme.
Une premi`ere problematique est liee `a la creation des modules de calcul du risque
cardiovasculaire : il sagit du module neuronal dinterpretation de lECG PEM, du
module bayesien de quantification des facteurs de risque `a partir des donnees du
dossier medical de lutilisateur du PEM, et de la couche de collaboration entre les
deux modules suivant un syst`eme `a base de r`egles de logique floue.
Une deuxi`eme problematique est liee au deploiement du module de synth`ese de
lECG 12D `a partir de lECG PEM 3D enregistre par lutilisateur (citoyen/patient)
lui-meme, avec le minimum dassistance professionnelle.
Une troisi`eme problematique est de rendre laide `a la decision dans le syst`eme
adaptee `a la specificite de chaque utilisateur.
Les autres problematiques liees `a la generation dalarmes et de leur niveau, la gestion de
lenvoi des alarmes tenant compte des non-reponses eventuelles des serveurs dalarme ou
des professionnels de sante contactes. . . seront bri`evement abordes.
4.2
109
Etat actuel de d
eveloppement du PEM `
a l
etape
de prototype
Quatre-vingt prototypes du PEM ont ete construits et evalues selon differents scenario
dutilisation dans differents centres, `a Lyon, Brescia, Catania, Lund et Trento, dans des
services durgence, des unites de soins intensifs, des cliniques de cardiologie, en medecine de
ville, au domicile du patient et en ambulatoire, par differents professionnels (cardiologues,
generalistes, techniciens ECG, infirmi`eres,. . . ) et par des patients eux-memes [7, 47].
Dans la suite de cette section, nous allons decrire les fonctionnalites et services disponibles dans le PEM `a letat actuel de developpement.
4.2.1
4.2.2
110
Architecture pervasive g
en
erique
Pour permettre une communication pervasive entre les acteurs de lapplication (utilisateur du PEM, SAMU, cardiologue, etc.) communiquant `a laide de divers outils (PEM,
telephone portable, PDA, etc.), EPI-MEDICS a realise une architecture generique basee
sur les technologies dInternet (TCP/IP) et le meta-language XML pour la representation,
le stockage et la communication des donnees [6, 142].
Larchitecture pervasive dEPI-MEDICS (Figure 4.2) consiste en une application principale installee sur un serveur web dont le principal objectif est dassurer la gestion de
lechange des messages, et des applications clients distribuees, la communication etant
securisee grace au protocole HTTPS. Un message contient une partie liee `a la communication, une copie du dossier de sante electronique, et tout autre fichier attache tel quun
ECG au format SCP-ECG. Pour assurer la bonne reception de linformation dans un delai
acceptable, larchitecture permet dacheminer partout, differents types de notification par
le biais des divers moyens et technologies de communication de l`ere actuelle (Pager, SMS,
PDA, etc.).
4.2.3
111
G
en
eration et gestion dalarmes
112
4.2.4
D
etection des arythmies et des isch
emies
La detection des arythmies est basee sur un syst`eme `a base de r`egles de logique floue.
Le module dinterpretation du rythme cardiaque, concu mais pas encore implante dans le
PEM, calcule les variations de lECG PEM par rapport `a un ECG de reference. Suivant
la categorie auquel correspond lutilisateur du PEM, `a savoir, athl`ete professionnel1 , sujet
sain, sujet avec des antecedents darythmies dans le passe, sujet souffrant de probl`emes
cardiaques, le module applique une serie de r`egles standards utilisees pour detecter larythmie. Ces r`egles originalement faites en logique booleenne ont ete traduites en logique floue
1
Il est en effet connu que lECG dun sportif professionnel est tr`es different de lECG dun sujet de
meme age, du meme sexe et de meme categorie diagnostique mais non sportif. En particulier, le segment
ST peut presenter des decalages par rapport `a la ligne de base de lECG avoisinant les crit`eres dischemie
chez un sujet sain, sportif professionnel
113
4.2.5
Lors de lenregistrement dun ECG, le PEM peut detecter un disfonctionnement cardiaque et contacter un centre dappel (SAMU) ou un professionnel de sante (medecin
traitant). Comme nous lavons dej`a explique, le PEM est concu pour envoyer lECG responsable du declenchement de lalarme dans un format comprehensible et interpretable
par les cardiologues, `a savoir lECG standard 12D, encode suivant la norme SCP-ECG.
Pour assurer la reconstruction de lECG standard, un module de synth`ese, base une matrice de transformation generique, a ete embarque dans le PEM.
Au cours du projet EPI-MEDICS, diverses approches de synth`ese ont ete evaluees
ou developpees, dont notamment la methode de reconstruction par reseaux de neurones
que jai developpe et presente dans ce rapport de th`ese. Cette methode originale et tr`es
prometteuse a ete testee sous Matlab mais na pas encore ete implementee dans le PEM.
Une etude va etre menee pour determiner la meilleure strategie de deploiement, du fait du
co
ut de calcul que necessite lapprentissage de comites de reseaux de neurones `a grande
echelle (tous les futurs utilisateurs du PEM). Quelques reponses sont fournies dans la
suite de ce chapitre.
4.3
Dun point de vue technique, lintegration des technologies danalyse multivariee telles
que les reseaux de neurones dans un syst`eme daide `a la decision tel que le PEM pour
realiser un module de synth`ese de lECG tend `a etre co
uteux en termes despace memoire
114
4.3.1
4.3.2
Bien que le choix dun dispositif compl`etement autonome semble etre seduisant, une
etude de linteret de lintroduction de telles puissances de calcul et surtout de son impact
au niveau du prix unitaire de lappareil, devrait etre effectuee.
Une solution moins co
uteuse et plus facilement evolutive au niveau materiel mais qui
peut etre plus compliquee `a mettre en place du point de vue logiciel, consiste `a se servir
des moyens de communication integres dans le PEM (Blue Tooth, GPRS, serveur web
. . . ) pour permettre la communication de donnees entre le PEM et les professionnels de
sante. De tels moyens permettent denvoyer les ECG collectes par le patient `a un serveur
web sur lequel chaque patient disposerait dun dossier medical electronique ainsi que de
sa propre base de donnees ECG. Ces donnees peuvent etre dynamiquement mises `a jour
et revisees au moyen de technologies de grilles de calcul et de services web.
115
SOAP (Simple Object Access Protocol) est un protocole de transmission de messages. SOAP nest
ni lie `a un syst`eme dexploitation ni `a un langage de programmation. En tant que tel, il sagit dun
important composant de base pour developper des applications distribuees
3
WSDL est le langage de description des services Web (Web Services Description Language). Un fichier
WSDL est un document XML decrivant un ensemble de messages SOAP et la mani`ere dont les messages
sont echanges
4
UDDI (Universal Discovery Description and Integration) est lequivalent des pages jaunes dans les
services Web. Une entree du repertoire UDDI est constituee dun fichier XML qui decrit une entreprise
et les services quelle offre.
116
de grille pervasive suscite de plus en plus dinteret en telemedecine [144]. La figure 4.5
illustre bien lutilite dune strategie de deploiement faisant appel `a de telles technologies
dans le cadre de notre application.
4.3.3
117
Sc
enario dutilisation du module de synth`
ese dECG
118
4.4
119
Conclusion
Dans ce chapitre, nous avons presente les aspects lies au deploiement et `a la maintenance de la plateforme decisionnelle du PEM, en particulier le module neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes. Nous avons
egalement presente les strategies de deploiement du module de reconstruction de lECG
par comites de reseaux de neurones integrant des serveurs web applicatifs et des grilles de
calcul. La mise en application de ce module dans le cadre dun scenario global `a grande
echelle de calcul dune matrice de synth`ese specifique `a chaque utilisateur du PEM serait
sans doute lune des principales perspectives de recherche future de nos travaux.
Quatri`
eme partie
Conclusion g
en
erale
120
Conclusion g
en
erale
Ce memoire constitue une presentation detaillee de mes travaux de recherche au cours
de 4 annees de th`ese. Ces travaux, qui sinscrivent dans la continuite du projet europeen
EPI-MEDICS qui a pour objectif la realisation dun moniteur personnel dECG (PEM),
ont contribue `a mettre en uvre les modules de diagnostic automatique de linfarctus et
la synth`ese de lECG standard. Ces modules seront les fondements de la future plateforme
daide `a la decision qui sera embarquee dans le PEM.
Trois domaines detude ont ete abordes dans cette th`ese : le classement automatique,
la fusion de donnees, et lapproximation de signaux. Pour chacune de ces parties, nous
presentons ci-apr`es un resume de notre contribution et quelques perspectives.
Interpr
etation automatique de lECG et fusion de
donn
ees
R
esum
e
Les travaux presentes dans la premi`ere partie du document (chapitre 2) interviennent
dans la realisation des divers modules de la plateforme intelligente daide `a la decision
qui sera ulterieurement integree dans le PEM. Cette plateforme, basee sur lutilisation
de techniques dintelligence artificielle, combinera `a la fois linterpretation de lECG du
patient et des donnees cliniques contenues dans son dossier medical personnel pour generer
un score de risque dinfarctus. Larchitecture fonctionnelle de la plateforme fut lobjet
dune presentation lors des Journees Sciences, Technologies et Imagerie pour la Medecine
`a Nancy en Mars 2005 [145].
Le module dinterpretation des ECG enregistres par lutilisateur lui-meme etablit un
diagnostic dinfarctus du myocarde par le biais des reseaux de neurones qui ont montre
une performance de diagnostic elevee, comparable `a celle des experts cardiologues. Cette
superiorite des reseaux de neurones, par rapport `a des approches traditionnelles telles que
lanalyse discriminante, provient principalement de la combinaison de leurs resultats.
122
Le module de stratification des facteurs de risque par reseaux bayesiens permet destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur
les facteurs de risque propres au patient. La performance enregistree par lapproche des
reseaux bayesiens sest averee tr`es prometteuse. Jai ete invite `a presenter une communication orale sur les resultats du module bayesien lors du 6`eme STAFF Studies Symposium
qui a ete organise par le Duke Medical Center de Durham `a St Jean dArdi`eres en septembre 2005. De meme, la presentation de la methode et des resultats viennent detre
acceptes pour publication `a la conference internationale IEEE Computers in Cardiology
2006 [115].
Perspectives
Les perspectives devolution et damelioration des methodes presentees dans cette
partie, les reseaux de neurones et les reseaux bayesiens, sont tr`es nombreuses pour diverses
raisons :
dune part liees au fait quil faudrait explorer de nouvelles approches doptimisation
des methodes actuelles. En effet, la marge de progression reste consequente :
au niveau du pretraitement des donnees (le choix de lACP pour les reseaux
de neurones. . . ),
et de loptimisation de lapprentissage neuronal via des techniques dapprentissage selective [96], evolutive [95], etc.
dautre part, lies au fait quil faudrait tester dautres techniques de prediction,
notamment pour le module de stratification des facteurs de risque. Les reseaux
bayesiens dynamiques devraient etre testes par rapport aux reseaux bayesiens statiques que nous avons utilises jusqu`a present. Mais cela est conditionne par le
fait davoir une base de donnees dynamique o`
u chaque patient dispose dun suivi
regulier avec enregistrement de tous les ECG, donnees cliniques, evolution diagnostique dans la base de donnees. En dautres termes, il faudrait avoir, pour le meme
patient, un historique medical complet et seriel afin de pouvoir etablir une stratification evolutive du risque cardiovasculaire. De meme, la construction (en cours)
dune base de donnees PEM (ECG PEM, ECG standards, donnees cliniques, etc.)
devrait permettre de tester differents scenarios dinteraction entre les classifieurs
grace `a la mise en uvre dalgorithmes de logique floue pour maximiser la sensibilite dinterpretation du syst`eme tout en conservant une specificite elevee.
Enfin, la validation des diverses methodes et techniques developpees au cours de cette
th`ese necessitent deffectuer des evaluations cliniques consequentes pour sassurer de la
qualite des algorithmes mis en place, evaluations qui sont de fait freinees par labsence
de bases de donnees dans ce domaine. Une premi`ere etape devaluation va etre effectuee
sur une serie de bases de donnees `a laquelle nous avons recemment eu acc`es (BUSSELTON [146], MRACS [147]). Ulterieurement, les methodes et algorithmes developpes et
implementes dans le syst`eme vont faire lobjet dune experimentation pilote et dune
evaluation clinique en region Rhone-Alpes dans le cadre du projet SIPIRA (Syst`eme
Integre Pervasif Intelligent de suivi de patients cardiaques en region Rhones-Alpes), etc.
123
Synth`
ese de lECG par comit
es de r
eseaux de neurones
R
esum
e
Lautre apport de cette th`ese est le developpement dune methode originale et performante permettant la synth`ese de lECG standard 12 derivations `a partir dun ECG
simplifie enregistre par le patient. Les evaluations effectuees sur une population detude
de 300 patients de la base de donnees de Lund ont montre une amelioration de plus de 15%
en qualite de signal par rapport aux methodes lineaires preconisees par la litterature. Les
resultats de cette experimentation ont ete presentes `a la conference internationale IEEE
Computers in Cardiology en septembre 2004 [140]. La deuxi`eme etape devaluation, diagnostique, sur la base de donnees de Lund est prevue pour publication. La troisi`eme etape
devaluation sur la base de donnees CHDB (ECG PEM 3D et ECG standard 12D) a ete
soumise pour publication dans la revue internationale Methods of Information in Medicine [141]. Cette derni`ere phase devaluation de la methode de synth`ese par reseaux de
neurones sur des ECG 12D seriels ou des ECG PEM enregistres dans des conditions simulant celles dutilisation du PEM (cest `a dire en ambulatoire ou `a domicile, acquisition
par le patient, son entourage ou une aide soignante, avec un positionnement delectrodes
different de celui de lECG standard 12D), a montre une performance largement superieure
`a celle de la litterature.
Perspectives
Lapproche de reconstruction que jai developpee a prouve son efficacite. La prochaine
etape consistera `a proceder au deploiement de la methode dans le PEM et `a prevoir
linfrastructure necessaire pour realiser lapprentissage neuronal `a grande echelle, `a savoir
le recours aux technologies des services web et grilles de calcul.
Le mot de la fin
Lobjectif de cette th`ese a ete de contribuer `a la conception et la realisation dun moniteur personnel dECG (PEM) capable de detecter les dysfonctionnements cardiaques, de
gerer des alarmes et de transmettre les informations relatives `a lutilisateur du syst`eme (citoyen/patient) aux services de sante concernes. Lensemble des travaux qui a ete presente
dans cette th`ese est motive par la volonte de developper un outil efficace de prevention
qui pourrait reduire la mortalite et la morbidite liees `a la survenue devenements cardiovasculaires en reduisant le temps separant lapparition des symptomes et le debut
des traitements. Nous esperons que cette etude servira `a stimuler la recherche dans ce
domaine.
Bibliographie
[1] World health statistics 2006, World Health Organization, Tech. Rep., 2006.
[2] Recommendations of a Task Force of the European Society of Cardiology and the
European Resuscitation Council on The Pre-Hospital Management of Acute Heart
Attacks, Eur Heart J, vol. 19, pp. 114064, 1998.
[3] J. McMurray et al., CardiologyI : Treatment of myocardial infarction, unstable
angina, and angina pectoris, BMJ, vol. 309, no. 6965, pp. 134350, 1994.
[4] R. Luepker, Delay in acute myocardial infarction : why dont they come to the
hospital more quickly and what can we do to reduce delay ? Am Heart J, vol. 150,
no. 3, pp. 36870, 2005.
[5] A. McGinn, D. Goff, H. Taylor, et al., Trends in prehospital delay time and use
of emergency medical services for acute myocardial infarction : experience in 4 US
communities from 1987-2000, Am Heart J, vol. 150, no. 3, pp. 392400, 2005.
[6] P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al., New paradigms in telemedicine : ambient intelligence, wearable, pervasive and personalized, Stud Health
Technol Inform, vol. 108, pp. 12332, 2004.
[7] P. Rubel, J. Fayn, S. Arod, H. Atoui, D. Telisson, et al., Intelligence Ambiante et
Syst`emes Pervasifs en Telemedecine. Exemples dApplications en Telecardiologie,
La Revue des SAMU, vol. 26, pp. 521526, 2004.
[8] Myocardial Infarction redefined - A concensus document of the joint European Society of Cardiology / American College of Cardiology Committee for the redefinition
of myocardial Infarction, Eur Heart J, vol. 21, pp. 15021513, 2000.
[9] S. Smith, S. Blair, R. Bonow, L. Brass, et al., AHA/ACC Guidelines for Preventing
Heart Attack and Death in Patients With Atherosclerotic Cardiovascular Disease :
2001 update. A statement for healthcare professionals from the American Heart
Association and the American College of Cardiology, J Am Coll Cardiol, vol. 38,
no. 5, pp. 15813, 2001.
[10] H. McGill, C. McMahan, E. Herderick, et al., Obesity accelerates the progression
of coronary atherosclerosis in young men, Circulation, vol. 105, no. 23, pp. 27128,
2002.
BIBLIOGRAPHIE
125
[11] L. Goldstein, R. Adams, M. Alberts, L. Appel, et al., Primary prevention of ischemic stroke : a guideline from the American Heart Association/American Stroke
Association Stroke Council, Circulation, vol. 113, no. 4, pp. 873923, 2006.
[12] J. Salonen, G. Alfthan, J. Huttunen, J. Pikkarainen, et al., Association between
Cardiovascular Death and Myocardial Infarction and Serum Selenium in a Matchedpair Longitudinal Study, Lancet, vol. 24, pp. 175179, July 1982.
[13] A. Kadish, A. Buxton, H. Kennedy, B. Knight, et al., ACC/AHA clinical competence statement on electrocardiography and ambulatory electrocardiography : A
report of the ACC/AHA/ACP-ASIM task force on clinical competence (ACC/AHA
committee to develop a clinical competence statement on electrocardiography and
ambulatory electrocardiography) endorsed by the International Society for Holter
and noninvasive electrocardiology, Circulation, vol. 104, no. 25, pp. 316978, 2001.
[14] J. Alpert, K. Thygesen, E. Antman, et al., Myocardial infarction redefineda
consensus document of The Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction, J Am
Coll Cardiol, vol. 36, no. 3, pp. 959969, 2000.
[15] B. McCarthy, J. Beshansky, et al., Missed diagnoses of acute myocardial infarction
in the emergency department : Results from a multicenter study, Ann Emerg Med,
vol. 22, pp. 579582, 1993.
[16] R. Puleo, D. Meyer, C. Wathen, C. Tawa, et al., Use of a rapid assay of subforms
of creatine kinase MB to diagnose or rule out acute myocardial infarction, N Engl
J Med, vol. 331, pp. 561566, 1994.
[17] R. Roberts et al., Earlier diagnosis and treatment of acute myocardial infarction
necessitates the need for a new diagnostic mind set, Circulation, vol. 89, pp.
872881, 1994.
[18] J. Pope, T. Aufderheide, R. Ruthazer, R. Woolard, et al., Missed diagnoses of acute
cardiac ischemia in the emergency department, N Engl J Med, vol. 342, no. 16, pp.
11631170, 2000.
[19] H. Koukkunen, K. Pyorala, et al., Low-risk patients with chest pain and without
evidence of myocardial infarction may be safely discharged from emergency department, Eur Heart Journal, vol. 25, pp. 329334, 2004.
[20] C. Swap et al., Value and Limitations of Chest Pain History in the Evaluation of
Patients With Suspected Acute Coronary Syndromes, JAMA, vol. 294, pp. 2623
2629, 2005.
[21] J. Willems, P. Arnaud, J. van Bemmel, R. Degani, et al., Common standards
for quantitative electrocardiography : goals and main results. CSE working party,
Methods Inf Med, vol. 29, no. 4, pp. 28997, 1990.
BIBLIOGRAPHIE
126
BIBLIOGRAPHIE
127
[36] V. Rialle, N. Noury, et al., An experimental health smart home and its distributed
internet-based information and communication system : first steps of a research
project, in Medinfo, vol. 10, no. 2, 2001, pp. 147983.
[37] J. Thomesse, D. Belot, A. Boyer, et al., Integrated information technologies for
patients remote follow up and homecare, in HealthCom, 2001, pp. 315.
[38] P. Rubel, J. Willems, C. Zywietz, J. Fayn, et al., Health in the New Communications
Age. IOS Press, 1995, vol. 24, ch. OEDIPE. Open European Data Interchange and
Processing for Electrocardiography, pp. 313321.
[39] Health in the New Communications Age. IOS Press, Amsterdam, 1995, vol. 24.
[40] J. van Bemmel, A. van Ginneken, H. Stam, et al., Integration and communication
for the continuity of cardiac care (i4c), J Electrocardiol, vol. 31, pp. 608, 1998.
[41] J. van Bemmel, Handbook of Medical Informatics. Springer, New York, 2002.
[42] P. Rubel et al., Protocole de communications standard pour lelectrocardiographie
quantitative, Informatique et Sante, vol. 4, pp. 4555, 1991.
[43] Medical informatics standard communication protocol-computer-assisted electrocardiography (SCP-ECG), ENV, Tech. Rep. 1064, 1993.
[44] J. Willems, P. Rubel, et al., Standard interchange for computerized electrocardiography, Stud Health Technol Inform, vol. 6, pp. 18594, 1993.
[45] P. Rubel, J. Willems, et al., Development of a conceptual reference model for digital
ECG data storage, in IEEE Computers in Cardiology, vol. 18, 1991, pp. 10912.
[46] P. Rubel, J. Willems, C. Zywietz, et al., Towards open data interchange and processing of serial ECGs, in IEEE Computers in Cardiology, vol. 19, 1992, pp. 7982.
[47] P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, et al., Toward personal eHealth in
cardiology. Results from the EPI-MEDICS telemedicine project, J Electrocardiol,
vol. 38, pp. 100106, 2005.
[48] E. Harold et al., XML in a Nutshell, Third Edition. OReilly Media, Paris, 2004.
[49] E. Berner, Clinical Decision Support Systems : Theory and Practice. Springer, NY,
1998.
[50] J. Haton, N. Bouzid, F. Charpillet, et al., Le raisonnement en intelligence artificielle.
InterEditions, Paris, 1991.
[51] A. Jain, R. Duin, et al., Statistical Pattern Recognition : a review, IEEE Trans
Pattern Anal Mach Intell, vol. 22, pp. 437, 2000.
[52] C. Bishop, Neural Networks for Pattern Recognition.
Oxford, 1996.
BIBLIOGRAPHIE
128
[53] B. Kirkwood et al., Essential Medical Statistics. Blackwell Science, UK, 2003.
[54] G. McLachlan, Discriminant Analysis and Statistical Pattern Recognition.
Interscience, Canada, 2004.
Wiley
[55] H. Bengtsson, Bayesian Networks : a Self-contained Introduction with Implementation Remarks, Mathematical Statistics, Lund Institute of Technology, Tech. Rep.,
1999.
[56] G. Luger, Artificial Intelligence : Structures and Strategies for Complex Problem
Solving. Addison Wesley, 2004.
[57] A. Sharkey et al., Diversity, Selection and Ensembles of Artificial Neural Nets,
in Proceedings of Third International Conference on Neural Networks and their
Applications, Marseille, France, March 1997, pp. 205212.
[58] J. Bailey, A. Berson, H. Handelsman, et al., Utility of Current Risk Stratification
Tests for Predicting Major Arrhythmic Events After Myocardial Infarction, JACC,
vol. 38, no. 7, pp. 190211, 2001.
[59] A. D. Timmis, Early diagnosis of acute myocardial infarction, BMJ, vol. 301, pp.
941942, 1990.
[60] A. Timmis, Will serum enzymes and other proteins find a clinical application in
the early diagnosis of myocardial infarction ? Br Heart J, vol. 71, pp. 309310,
1994.
[61] H. Lee, S. Cross, P. Garthwaite, A. Dickie, I. Ross, et al., Comparison of the value
of novel rapid measurement of myoglobin, creatine kinase, and creatine kinase-MB
with the electrocardiogram for the diagnosis of acute myocardial infarction, Br
Heart J, vol. 71, pp. 311315, 1994.
[62] J. Mair, J. Smidt, P. Lechleitner, F. Dienstl, et al., A decision tree for the early
diagnosis of acute myocardial infarction in nontraumatic chest pain patients at
hospital admission, Chest, vol. 108, pp. 15021509, 1995.
[63] L. Jeanpierre et al., Automated medical diagnosis with fuzzy stochastic models :
monitoring chronic diseases, Acta Biotheor, vol. 52, no. 4, pp. 291311, 2004.
[64] D. Bellot, Fusion de donnees avec des reseaux bayesiens pour la modelisation des
syst`emes dynamiques et son application en telemedecine, Ph.D. dissertation, Universite Nancy1, 2002.
[65] P. Lisboa, Artificial neural networks in biomedicine. Springer-Verlag, London, 2000.
[66] W. Baxt, Use of an artificial neural network for the diagnosis of myocardial infarction, Ann Intern Med, vol. 115, no. 11, pp. 843848, 1991.
BIBLIOGRAPHIE
129
[67] R. Harrison, S. Marshall, et al., The early diagnosis of heart attacks : a neurocomputational approach, in International Joint Conference on Neural Networks,
vol. 1, 1991, pp. 15.
[68] R. Kennedy, R. Harrison, A. Burtonc, et al., An artificial neural network system
for diagnosis of acute myocardial infarction (AMI) in the accident and emergency
department : evaluation and comparison with serum myoglobin measurements,
Comput Methods Programs Biomed, vol. 52, pp. 93103, 1997.
[69] W. Baxt, F. Shofer, F. Sites, et al., A neural computational aid to the automated
diagnosis of acute myocardial infarction, Ann Emerg Med, vol. 34, pp. 366373,
2002.
BIBLIOGRAPHIE
130
BIBLIOGRAPHIE
131
BIBLIOGRAPHIE
132
BIBLIOGRAPHIE
133
[127] J. Scherer et al., Synthesis of the 12-Lead Electrocardiogram from a 3-Lead Semiorthogonal Subset using Patient-specific Transformation Arrays, in IEEE Computers in Cardiology, 1988, pp. 149151.
[128] S. Nelwan, J. Kors, S. Meij, J. van Bemmel, et al., Reconstruction of the 12-lead
electrocardiogram from reduced lead sets, J Electrocardiol, vol. 37, no. 1, pp. 1118,
2004.
[129] R. Duin, Learned from Neural Networks, in ASCI 2000, Sixth Annual Conference
of the Advanced School for Computing and Imaging, 2000, pp. 913.
[130] S. Mitra, S. Pal, et al., Data Mining in Soft Computing Framework : A Survey,
IEEE Trans Neural Netw, vol. 13, no. 1, pp. 314, 2001.
[131] K. Hornik, M. Stinchcombe, et al., Multilayer feedforward networks are universal
approximators, Neural Netw, vol. 2, no. 359-366, 1989.
[132] K. Funahashi, On the Approximate Realization of Continuous Mappings by Neural
Networks, Neural Netw, vol. 2, pp. 183192, 1989.
[133] J. Castro, C. Mantas, et al., Neural networks with a continuous squashing function
in the output are universal approximators, Neural Netw, vol. 13, no. 6, pp. 5613,
2000.
[134] P. Macfarlane, Age, sex, and the ST amplitude in health and disease, J Electrocardiol, vol. 34, pp. 23541, 2001.
[135] M. Krucoff, Electrocardiographic monitoring and coronary occlusion. Fingerprint
pattern analysis in dimensions of space, time, and mind, J Electrocardiol, vol. 22,
pp. 2327, 1989.
[136] G. Nollo, P. Rubel, J. Fayn, D. Assanelli, M. Crotti, et al., PEM device and
EPI-MEDICS telemedical architecture final assessment report, Information Society
Technologies Programme, Tech. Rep. D6.1, 2004.
[137] The CSE Party : Recommendations for measurement standards in quantitative
electrocardiography, Eur Heart J, vol. 6, pp. 815825, 1985.
[138] M. Moller, A scaled conjugate gradient algorithm for fast supervised learning,
Neural Netw, vol. 6, pp. 525533, 1993.
[139] S. Orfanidis, Optimum Signal Processing. An Introduction. 2nd Edition. PrenticeHall, Englewood Cliffs, NJ, 1996.
[140] H. Atoui, J. Fayn, et al., A Neural Network Approach for Patient-Specific 12Lead ECG Synthesis in Patient Monitoring Environments, in IEEE Computers in
Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 161164.
BIBLIOGRAPHIE
134
[141] H. Atoui et al., A Novel Neural Network Model for Deriving Standard 12-lead ECGs
from serial 3-lead ECGs. Application to Self Care, 2006, submitted to Methods Inf
Med.
[142] D. Telisson, J. Fayn, et al., Design of a Tele-Expertise Architecture Adapted to
Pervasive Multi-Actor Environments. Application to eCardiology, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 749752.
[143] L. Simon-Chautemps, S. Arod, S. Adami, J. Fayn, C. Malossi, et al., Final Prototype, Information Society Technologies Programme, Tech. Rep. D7.2, 2004.
[144] P. Gouvas, G. Magiorkinis, A. Bouras, D. Paraskevis, et al., Web Service-Enabled
Grid-Based Platform for Drug Resistance Management, in Panhellenic Conference
on Informatics, vol. 3746, 2005, pp. 469479.
[145] H. Atoui, D. Telisson, et al., Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide `a la decision par reseaux de
neurones du projet europeen EPI-MEDICS. in Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005, pp. 1314.
[146] M. Knuiman, H. Vu, et al., Multivariate risk estimation for coronary heart disease :
the Busselton health study, New Zealand Journal of Public Health, vol. 22, pp. 747
753, 1998.
[147] The MRACS study. URL http ://www.rcbweb.co.uk.
Cinqui`
eme partie
Annexes
135
Annexe A
Dossier M
edical Personnel embarqu
e
dans le PEM
A.1
Ce dossier sera enregistre dans la Data Card du PEM (PEM Card) et sera consultable/modifiable au moyen dun navigateur Internet standard (connexion par RS232C ou
Bluetooth `a un PC, un MAC ou un Palmtop). Par defaut, une donnee non renseignee sera
marquee Non Renseignee (NR). Lorsque lon remplit le dossier, et que lon ne sait pas
renseigner la donnee, on pourra utiliser le terme : inconnu (I). Des exemples ditems
pour lequel on pourra utiliser le terme inconnu sont : le sexe, le diab`ete, la localisation
des stenoses, etc.
A.2
Donn
ees d
emographiques
Cette section ne contient que les donnees utiles au professionnel de sante lorsquil
entreprend de visualiser et/ou de mettre `a jour le dossier de sante du patient. Les donnees
demographiques compl`etes (avec adresse, numeros de telephone, description des contacts
etc.) sont indiquees dans la section contacts.
Nom
Prenom
Date de naissance : JJ/MM/AAA ou Age (ans)
Poids (Kg)
Taille (cm)
Sexe : (M, F, I)
A.3
137
R
esultats danalyses biologiques
A.4
A.4.1
El
ements du dossier cardiologique
Donn
ees cliniques
A.4.2
Interpr
etation de lECG au repos
138
Interpretation de lECG standard `a 12D : (Normal, probablement normal/non strictement normal, Anormal)
Troubles de la conduction : (O/N)
Instabilite electrique : (O/N)
Alteration(s) mineure(s) de lECG : (O/N)
A.4.3
R
esultats des tests de lECG deffort
A.4.4
Diagnostic cardiologique
A.4.5
139
Proc
edures et traitements
A.5
A.5.1
Classe de Sant
e
Indiquez ci-apr`es la categorie qui decrit le mieux possible letat general de sante du
patient. Ce classement sera utilise pour moduler lestimation du facteur de risque du sujet.
Categorie de sante : I, 1, 2, 3, 4, 5
Avec :
1. Sportif de niveau professionnel
2. Sujet normal
3. Suspicion dischemie et/ou de troubles du rythme
4. Ischemie et/ou troubles du rythme averes
5. Pathologie cardiaque documentee
A.5.2
Sexe : (M, F, I)
Age :
Tabagie : (Non fumeur, Ex-Fumeur, Fumeur)
Obesite : (O/N)
Diab`ete : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))
Hypertension arterielle : (O/N)
Frequence cardiaque au repos (battements/mn) :
Cholesterol total (mg/dl) :
Fibrinog`enes (mg/dl) :
A.5.3
140
Annexe B
La base de donn
ees INDANA
La base de donnees INDANA (INdividual Data ANalysis of Antihypertensive drug
interventions) reunit les donnees individuelles de 10 essais therapeutiques (controles randomises) conduits pour evaluer lefficacite de traitements anti-hypertenseurs [103].
Les sujets faisant partie de cette base de donnees ont ete suivis, en moyenne, sur une
periode de 5 ans et toute incidence devenements de nature cardiovasculaire a ete releve :
accident vasculaire cerebral, infarctus du myocarde, dec`es par accident vasculaire cerebral,
dec`es par infarctus du myocarde.
Cette base de donnees a ete mise en forme et est maintenue par lUnite de Pharmacologie Clinique de lUniversite Lyon 1 (chef de projet : Francois Gueyffier).
142
Tab. B.1 Tableau descriptif des variables et labels de la base de donnees INDANA
Nom
SEX
AGE
BL HEIGH
BL WEIGH
BL BLO U
BL NBCIG
BL HR
BL SBP
BL DBP
BL ECGM1
Label
sexe
age
taille en debut detude
poids en debut detude
hematurie en debut detude
nombre de cigarettes en debut detude
frequence cardiaque en debut detude
pression arterielle systolique en debut detude
pression arterielle diastolique en debut detude
Q/QS Pattern
BL ECGM3
BL ECGM4
BL ECGM5
BL AF
BL GLUC
BL URIC
BL CHOL
BL CREAT
BL GLY U
BL PRT U
BL K
BL SMOKE
BL CATSM
BL UREA
BL BMI
HX DIAB
HX TTHBP
HX HBP
HX ANGIN
HX MI
HX ST
HX CLAUD
ST
MI
DEATH
DEATHMI
DEATHST
DEATHCV
Valeur
0 : femme, 1 : homme
en annees
en cm
en kg
nbre/jour
batt/mn
mmHg
mmHg
( 0 : pas danomalie,
1 anomalie la
moins significative,
2,...x anomalie
la plus significative)
0 : non ; 1 : oui
mmol/l
mmol/l
mmol/l
mmol/l
0 : non 1 :oui
0 : non 1 :oui
mmol/l
0 : non ; 1 :oui
4 categories
mmol/l
kg/m2
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
Annexe C
Architecture des r
eseaux de
neurones utilis
es pour la synth`
ese de
lECG
La meilleure configuration en termes darchitecture des reseaux de neurones utilises
pour la synth`ese de lECG standard est determinee experimentalement en effectuant lapprentissage de hnt structures obtenues en faisant varier le nombre de couches cachees
(h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction dactivation (t=lineaire (purelin), sigmode : tangente sigmode (tansig), logarithme-sigmode
(logsig)). Les resultats detailles des performances des hnt structures en termes derreur RMS sur les 100 ECG de la population detude DS1 sont presentes dans les tableaux
ci-apr`es.
Nb de couches cachees
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
RMS
107.98
94.72
89.87
89.44
87.47
115.52
104.08
96.95
96.27
91.40
100.14
95.26
90.87
90.82
89.63
Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 144
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
RMS
117.78
110.47
103.46
101.42
100.84
114.30
103.32
99.24
97.08
94.485
113.30
104.99
96.62
96.03
91.26
113.33
102.28
97.10
95.60
92.09
112.58
101.45
97.96
95.56
90.12
121.66
115.30
110.08
108.10
105.99
119.17
111.17
107.33
104.65
100.16
117.73
112.15
104.04
104.35
97.04
118.9
109.96
104.86
102.33
99.02
117.48
108.28
105.56
103.82
97.31
Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 145
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
RMS
110.11
101.46
100.79
99.89
97.14
101.78
96.90
93.12
92.41
89.65
100.15
94.74
92.42
91.91
91.29
97.99
93.75
91.52
89.66
89.32
96.93
92.92
89.76
89.12
90.35
117.41
110.35
106.52
104.34
106.19
105.43
101.04
96.76
94.11
92.29
100.34
93.265
91.50
90.36
90.53
100.75
92.43
89.99
90.37
89.72
96.16
90.46
89.38
87.93
92.54
Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 146
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
RMS
122.05
115.65
110.84
108.03
108.32
117.67
111.40
104.12
100.06
96.97
116.08
105.17
100.78
99.05
92.58
114.79
104.51
99.75
95.49
92.54
115.55
105.04
97.74
94.80
91.58
126.31
121.16
115.39
112.54
113.79
120.73
117.93
110.83
106.81
104.96
121.37
111.08
107.47
106.55
100.68
118.47
111.33
106.69
104.07
99.01
119.30
111.37
105.10
102.21
98.76
Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 147
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
RMS
126.65
120.57
115.92
114.46
113.48
116.13
111.22
105.66
102.11
99.47
109.41
102.86
98.09
94.47
93.91
110.20
102.04
95.61
95.74
92.07
101.85
97.26
92.90
91.43
91.55
122.77
114.97
108.59
105.43
104.80
119.26
111.48
103.36
100.10
95.90
118.56
105.08
101.52
99.86
93.03
115.71
105.83
100.65
96.69
92.68
118.88
107.36
99.58
96.40
93.07
Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 148
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
RMS
126.31
120.69
113.88
110.74
111.16
122.06
118.14
110.36
106.14
103.40
122.82
111.39
107.13
105.85
99.45
118.97
112.70
106.20
104.47
98.62
121.73
112.47
106.11
102.59
98.71
Annexe D
SCPECG Processor
Description
Pour faciliter le traitement des ECGs enregistres au format SCP-ECG par les outils
daide `a la decision developpes dans le cadre dEPI-MEDICS, nous avons developpe un
logiciel autonome (stand-alone) intitule SCP-ECG processor (Figure D.1). Ce logiciel
permet danalyser les ECGs par le biais dune serie de modules qui ont ete developpes.
Il est egalement dote dun module daide `a la decision `a base de comites de reseaux de
neurones similaire `a celui developpe dans le chapitre 2 de ce rapport de th`ese et dun
module de synth`ese de lECG par regression generique et specifique. De meme ce logiciel
est concu pour integrer tout autre module danalyse, dinterpretation, ou daide `a la
decision (les modules de reseaux bayesiens, de logique floue, etc.).
150
151
Annexe E
EPI-MEDICS : mod`
eles de donn
ees
globaux du PEM
153
154
Annexe F
Publications
Revues internationales avec comit
e de lecture
H. Atoui, D. Sarrut, S. Miguet. A Fast Morphing-Based Interpolation For Medical Images : Application To Conformal Radiotherapy. Image Anal Stereol, 2006 ;
25(2) :95-103.
H. Atoui, J. Fayn, P. Rubel. A Novel Neural Network Model for Deriving Standard
12-lead ECGs from serial 3-lead ECGs. Application to Self Care. Submitted to
Methods Inf Med.
P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, L. Restier, S. Adami, S. Arod, H.
Atoui, et al. Toward personal eHealth in cardiology. Results from the EPI-MEDICS
telemedicine project. J Electrocardiol, 2005 ;38 :100-106.
Annexe F. Publications
156
Conf
erences internationales avec comit
e de lecture
H. Atoui, J. Fayn, F. Gueyffier, and P. Rubel. Cardiovascular Risk Stratification
in Decision Support Systems, A Probabilistic Approach. Application to pHealth.
Accepted for publication in Computers in Cardiology 2006.
H. Atoui, J. Fayn and P. Rubel. A Neural Network Approach for Patient-specific
12-lead ECG Synthesis in Patient Monitoring Environments. In : Murray A., Ed.,
Computers in Cardiology, Los Alamitos (USA) : IEEE Computer Society, 2004 ;
31 :161-64.
H. Atoui, D. Sarrut, S. Miguet. Usefulness of Image Morphing Techniques in Cancer Treatment by Conformal Radiotherapy. In : Robert L. Galloway, Ed., Medical
Imaging : Visualization, Image-Guided Procedures, and Display, 2004 ; 5367 :332-40.
J. Fayn, C. Ghedira, D. Telisson, H. Atoui, P. Rubel, et al. Towards New Integrated Information and Communication Infrastructures in eHealth. Examples from
Cardiology. In : Murray A., Ed., Computers in Cardiology, Los Alamitos (USA) :
IEEE Computer Society, 2003 ; 30 :113-16.
Conf
erences internationales invit
ees
P. Rubel, J. Fayn, H. Atoui, D. Telisson, P. Chevalier. From eHealth to Pervasive
Solutions and Ambient Intelligence in pHealth. An International Perspective with
Examples from Cardiology. International Initiative for Ubiquitous Healthcare (uHealth), Med-e-Tel, Luxembourg, April 5-7, 2006.
H. Atoui, J. Fayn, P. Rubel. Advanced methods of data fusion of ECG and clinical
data for self-care diagnosis enhancement. 6th STAFF Studies Symposium. September 28 - October 1, 2005.
P. Rubel, J. Fayn, H. Atoui, et al. Pre-hospital acute decision support. 6th STAFF
Studies Symposium. September 28 - October 1, 2005.
J. Fayn, H. Atoui, P. Rubel, et al. Embedded decision making in eCardiology.
Lessons learned from the EPI-MEDICS project. International Workshop on Personalised Health, Belfast, December 13-15, 2004.
P. Rubel, J. Fayn, H. Atoui, D. Telisson. Beyond EPI-MEDICS. In Proceedings of
the 2nd OpenECG Workshop. Integration of the ECG into the EHR & Interoperability of the ECG Device Systelms. Berlin, Germany, April 1-3, 2004 :75-6.
P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al. New paradigms in Telemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. eHealth
Workshop : New generation of wearable systems for health : Towards a revolution
of citizens health and life style management ? Lucca, Italy, December 12-14, 2003.
Annexe F. Publications
157
Conf
erences nationales avec comit
e de lecture
H. Atoui, D. Telisson, et al. Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide `a la decision par reseaux
de neurones du projet europeen EPIMEDICS. Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005 : 13-14.
Conf
erences ou journ
ees th
ematiques nationales
H. Atoui. Conception de syst`emes intelligents pour la telemedecine citoyenne. Rencontres Regionales de la Recherche, Lyon, 2004 (poster).
S
eminaires
Techniques dimagerie pour laide au positionnement du patient en radiotherapie
conformationnelle. Octobre 2002. Laboratoire ERIC
Conception de Syst`
emes Intelligents pour la T
el
em
edecine
Citoyenne
Hussein ATOUI
R
esum
e
Ces recherches sinscrivent dans la continuite du projet europeen EPIMEDICS (Enhanced Personal Intelligent & Mobile system for Early Detection & Interpretation of Cardiovascular Syndromes) du programme Information Society Technologies,
qui a pour objectif la realisation dun moniteur personnel dECG (PEM) intelligent, dote
dun serveur embarque et dun composant metier danalyse quantitative de lECG, compact, portable et utilisable par tous, y compris par le patient lui-meme, un aidant, ou
nimporte quel citoyen. Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des informations spatio-temporelles produite par lactivite du cur
et capable denvoyer par GPRS ou UMTS differents types de messages ou dalarmes
convoyant des ECG et un mini-dossier medical de lutilisateur. Cest dans ce contexte que
nous avons cherche `a ameliorer lintelligence du syst`eme en developpant une plateforme
auto-adaptative et auto-evolutive de detection automatique des dysfonctionnements du
coeur. Cette plateforme permet de stratifier le risque de la survenue dun ev`enement cardiovasculaire moyennant linterpretation de lECG combinee avec lhistorique medical de
lutilisateur.
Laide au diagnostic consiste `a mettre en oeuvre des algorithmes resolvant un probl`eme de
classement compte tenu de lincertitude sur la situation reelle de lobjet etudie. Les travaux
presentes dans ce memoire etudient differents aspects de cette tache. Tout dabord, nous
proposons une modelisation du processus de diagnostic de linfarctus `a partir de lECG.
Linterpretation automatique de lECG est effectuee `a laide de comites de reseaux de
neurones artificiels. Une serie dexperimentations illustre la superiorite des reseaux de
neurones par rapport aux resultats obtenus par des cardiologues interpretant le meme ensemble de donnees. Ensuite, afin dobtenir un diagnostic plus precis et plus personnalise,
nous proposons dinclure une stratification des informations cliniques de lutilisateur telles
que les facteurs de risque. Notre approche consiste `a utiliser les reseaux bayesiens pour
etablir une quantification probabiliste du risque cardiovasculaire. Nous proposons enfin
un algorithme permettant de fusionner le score de linterpretation de lECG realisee par
les reseaux de neurones avec celui obtenu par les reseaux bayesiens `a partir des facteurs
de risque. Cette fusion constitue lun des fondements de la future plateforme daide `a la
decision qui sera embarquee dans le PEM, syst`eme qui sera `a la fois auto-adaptatif en
fonction de la specificite de chaque utilisateur et auto-evolutive grace au potentiel dapprentissage automatique des reseaux de neurones et des reseaux bayesiens.
Dans la deuxi`eme partie de cette th`ese, nous etudions un formalisme permettant de rendre
lECG simplifie du PEM accessible, sous un format comprehensible et interpretable, aux
professionnels de sante. Il sagit de synthetiser un ECG standard 12D `a partir de lECG
3D du PEM. Cette synth`ese doit permettre non seulement une detection precise, mais
egalement une reproduction la plus fid`ele possible des caracteristiques de lECG standard
si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM. Cest la raison
pour laquelle nous nous sommes orientes vers des techniques dintelligence artificielle mettant en uvre une methode originale de reconstruction des ECG basee sur lutilisation
de comites de reseaux de neurones. Une serie de tests sur des bases de donnees dECG
standards et dECG PEM enregistres dans des conditions simulant celles dutilisation du
PEM, a montre que notre approche a largement depasse les methodes conventionnelles.
Enfin, nous avons travaille sur la conception de strategies de deploiement pour la mise en
uvre de methodes de synth`ese de lECG specifique `a chaque patient au moyen dinfrastructures ad hoc permettant de realiser lapprentissage neuronal `a grande echelle, grace
aux technologies des services web et des grilles de calcul.
Mots cl
es Syst`emes pervasifs - Intelligence ambiante - Intelligence artificielle - Fusion
de donnees - Aide `a la decision - Telemedecine citoyenne