Thèse

Departement Informatique
Ecole
Doctorale Informatique et Information pour la Societe
Conception de Syst`
emes Intelligents
pour la T
el
em
edecine Citoyenne
Th`
ese
presentee et soutenue publiquement le 29 Septembre 2006
pour lobtention du
Doctorat de lINSA de Lyon

(specialite informatique)
par
Hussein Atoui
Composition du jury
Rapporteurs:
Directeurs de thèse:
Francois Charpillet
Joel Colloc
Paul Rubel
Examinateur
Jocelyne Fayn
Jean-Pierre Boissel
Directeur de Recherche INRIA

Professeur, Universite du Havre
Professeur, INSA de Lyon
Directeur de lINSERM ERM107
Ingenieur de Recherche, INSERM
Professeur, Departement de Pharmacologie Clinique
Faculte RTH Laennec
INSERM ERM 107, MTIC (Methodologies de Traitement de lInformation en Cardiologie)
` ma famille, mes amis, mon village, mon sud,

A
`
A tous les etres chers perdus victimes de la barbarie qui
a ravage le Liban dans lindifference et la complicite du
monde entier,
` tous celles et ceux qui mont aide pendant ces annees, un grand Merci.
A
Table des mati`

eres
Table des mati`
eres
vi
Introduction
II Aide `
a la d
ecision en m
edecine, le projet europ
een EPIMEDICS
5
1 Maladies cardiovasculaires, t
el
em
edecine et aide `
a la d
ecision
1.1 Contexte medical . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Le diagnostic . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Lelectrocardiologie quantitative . . . . . . . . . . . . . . . . . . .
1.2.1 LECG standard 12D . . . . . . . . . . . . . . . . . . . . .
1.2.2 LECG : les differentes ondes et les intervalles de temps . .
1.2.3 LECG, outil de detection du dysfonctionnement cardiaque
1.3 La telemedecine citoyenne : le projet EPI-MEDICS . . . . . . . .
1.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Evolution : passe, present et futur . . . . . . . . . . . . . .
1.3.3 EPI-MEDICS . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Laide à la decision en medecine . . . . . . . . . . . . . . . . . . .
1.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Les systèmes daide à la decision . . . . . . . . . . . . . .
1.4.3 Les principales approches utilisees pour laide à la decision
1.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6
6
7
7
8
9
9
14
14
15
17
20
20
20
21
23
III Conception, validation et strat

egies de d
eploiement de la
plateforme d
ecisionnelle dEPI-MEDICS
25
2 Aide `
a la d
ecision en t
el
ecardiologie
2.1 Contexte et objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Interpretation automatique de lECG . . . . . . . . . . . . . . . . . . . .
2.2.1 Les reseaux de neurones . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Conception, realisation et evaluation du module dinterpretation de
lECG par reseaux de neurones . . . . . . . . . . . . . . . . . . .
26
. 26
. 27
. 28
. 34
iv
2.3
2.4
2.2.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Quantification du risque cardiovasculaire par approche probabiliste . . .
2.3.1 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Les reseaux bayesiens . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Apprentissage des reseaux bayesiens . . . . . . . . . . . . . . . . .
2.3.4 Configuration du modèle probabiliste de stratification du risque cardiovasculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.5 La base de donnees INDANA . . . . . . . . . . . . . . . . . . . .
2.3.6 Realisation du reseau bayesien . . . . . . . . . . . . . . . . . . . .
2.3.7 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.8 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vers un modèle multi-classifieurs multi-modules du diagnostic de linfarctus : Interaction du module neuronal et du module bayesien dans le processus decisionnel global . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 Acquisition de lECG PEM et synth`

ese de lECG standard
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Modalites dacquisition de lECG PEM . . . . . . . . . . . . . . . . . . .
3.3 Approches conventionnelles . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Bases de donnees dapprentissage et de test . . . . . . . . . . . . . . . . .
3.6 Configuration du modèle de synthèse de lECG standard 12D par reseaux
de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.1 Constitution des ensembles dapprentissage et de test . . . . . . .
3.6.2 Evaluation de la variation naturelle intra-patients entre les ECG de
reference et les ECG durgence . . . . . . . . . . . . . . . . . . . .
3.6.3 Configuration de la structure des reseaux de neurones . . . . . . .
3.6.4 Processus dapprentissage et devaluation . . . . . . . . . . . . . .
3.6.5 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Evaluation diagnostique sur la base de donnees de Lund . . . . . . . . .
3.7.1 Ensemble dapprentissage et ensemble de test . . . . . . . . . . .
3.7.2 Configuration et apprentissage des comites de reseaux de neurones
specifiques aux patients . . . . . . . . . . . . . . . . . . . . . . . .
3.7.3 Comparaison des interpretations automatiques des ECG synthetises
par rapport à la verite clinique . . . . . . . . . . . . . . . . . . .
3.7.4 Discussion & Conclusion . . . . . . . . . . . . . . . . . . . . . . .
3.8 Evaluation de la qualite de la synthèse des ECG standards 12D à partir
des ECG 3D du PEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.2 Population detude . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.3 Pretraitement des ECG . . . . . . . . . . . . . . . . . . . . . . .
3.8.4 Configuration de la structure des reseaux de neurones . . . . . . .
.
.
.
.
.
45
48
50
52
59
.
.
.
.
.
.
60
61
62
64
64
65
. 65
.
.
.
.
.
68
68
69
71
72
73
. 74
. 74
.
.
.
.
.
.
.
.
74
75
76
79
82
82
83
84
. 85
. 85
. 87
.
.
.
.
.
88
88
89
90
91
v
3.8.5 Processus dapprentissage des reseaux de neurones generiques
3.8.6 Processus dapprentissage des reseaux de neurones specifiques
3.8.7 Verification et validation de la synthèse de lECG 12D . . . .
3.8.8 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
91
93
93
95
105
106
4 Mise en place de la plateforme d

ecisionnelle du PEM
108
4.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.2 Etat actuel de developpement du PEM à letape de prototype . . . . . . . 109
4.2.1 Le PEM : intelligence embarquee dans un environnement pervasif
multi-acteurs de telemedecine citoyenne . . . . . . . . . . . . . . . . 109
4.2.2 Architecture pervasive generique . . . . . . . . . . . . . . . . . . . . 110
4.2.3 Generation et gestion dalarmes . . . . . . . . . . . . . . . . . . . . 111
4.2.4 Detection des arythmies et des ischemies . . . . . . . . . . . . . . . 112
4.2.5 Reconstruction de lECG standard 12D à partir de lECG PEM 3D 113
4.3 Vers un produit final : strategies de deploiement du module de synthèse de
lECG embarque dans le PEM . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.3.1 Le PEM, un dispositif autonome . . . . . . . . . . . . . . . . . . . 114
4.3.2 Le PEM, un dispositif semi-autonome . . . . . . . . . . . . . . . . . 114
4.3.3 Scenario dutilisation du module de synthèse dECG . . . . . . . . . 117
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
IV
Conclusion g
en
erale
120
Bibliographie
124
Annexes
A Dossier M
edical Personnel embarqu
e dans le PEM
A.1 Contenu du dossier de sante du patient . . . . . . . .
A.2 Donnees demographiques . . . . . . . . . . . . . . . .
A.3 Resultats danalyses biologiques . . . . . . . . . . . .
A.4 Elements du dossier cardiologique . . . . . . . . . . .
A.4.1 Donnees cliniques . . . . . . . . . . . . . . . .
A.4.2 Interpretation de lECG au repos . . . . . . .
A.4.3 Resultats des tests de lECG deffort . . . . .
A.4.4 Diagnostic cardiologique . . . . . . . . . . . .
A.4.5 Procedures et traitements . . . . . . . . . . .
A.5 Facteurs de risque cardiovasculaire . . . . . . . . . .
A.5.1 Classe de Sante . . . . . . . . . . . . . . . . .
A.5.2 Facteurs de risque majeurs . . . . . . . . . . .
A.5.3 Autres facteurs de risque . . . . . . . . . . . .
135
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
136
. 136
. 136
. 137
. 137
. 137
. 137
. 138
. 138
. 139
. 139
. 139
. 139
. 140
vi
B La base de donn
ees INDANA
141
C Architecture des r
eseaux de neurones utilis
es pour la synth`
ese de lECG143
D SCPECG Processor
149
E EPI-MEDICS : mod`
eles de donn
ees globaux du PEM
152
F Publications
155
R
esum
e
158
Liste des tableaux

2.1
2.2
2.3
2.4
2.5
2.6
2.7
3.1
3.2
3.3
Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage
est ensuite effectue sur les N 1 sous-ensembles s2 à S5 et lerreur est calculee sur le sous-ensemble restant s1, servant de validation. Cette operation
est reiteree quatre fois en choisissant chaque fois un ensemble de validation
different. Enfin, un taux derreur moyen est calcule et lapprentissage est
refait en utilisant la totalite de lensemble de donnees. . . . . . . . . . . . .
Matrice de confusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG
durgence de lensemble de test, effectuee par les deux experts, en fonction
de la verite clinique (199 cas dinfarctus (AMI) et 789 cas de controle). Ce
tableau illustre les resultats de linterpretation unaire effectuee sur les ECG
durgence sans avoir eu connaissance des ECG de reference des patients. . .
Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse
serielle) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scores de risque en pourcentage de la survenue dune maladie coronaire en
fonction de lage, du sexe et des caracteristiques de la douleur de thoracique.
Daprès Diamond et Forrester, N Engl J Med 1979. . . . . . . . . . . . . .
Illustration du deroulement de lalgorithme de triangulation. Les clusters
retenus pour larbre de jonction sont marques par une etoile (*). . . . . . .
Variables retenues pour realiser les modèles de stratification : reseau bayesien,
comite de reseau de neurones et analyse discriminante. . . . . . . . . . . .
33
40
42
43
51
57
61
Correlations moyennes (en pourcentage) entre les derivations dorigine et

les derivations synthetisees au moyen dun modèle de regression generique
en fonction du sous-ensemble de derivations ECG 12D utilisees comme
entrees pour la synthèse. Resultats extraits de [119] portant sur un ensemble
dapprentissage de 72 ECG 12D sans ensemble de test independant. . . . . 71
Erreur quadratique moyenne (RMS) en V entre les derivations DI, DII,
V1, V2, V3, V4, V5 et V6 des ECG de reference et ECG durgence des sous
ensembles DS1, DS2 et DS3, après exclusion des 5 valeurs les plus extremes. 79
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
(r) entre les derivations V1,V3. . . V6 originales et celles synthetisees par
les comites de reseaux de neurones specifiques (ANN-S) et les modèles de
regression specifiques (REG-S) sur les ECG des sous-ensembles DS1, DS2
et DS3, après elimination des 5 valeurs les plus extremes. . . . . . . . . . . 81
viii
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de

la difference en termes derreur RMS obtenue par les comites de reseaux
de neurones et les modèles de regression specifiques. . . . . . . . . . . . . . 81
Concordance entre les interpretations des ECG originaux et les interpretations
des ECG synthetises par reseaux de neurones (ANN-S) et par regression
(REG-S). Le logiciel de diagnostic classe les ECG suivant 4 categories de
risque : pas de risque, risque mineur, moyen et majeur. . . . . . . . . . . . 87
Description de la base de donnees CHDB. . . . . . . . . . . . . . . . . . . 89
entre les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du
deuxième ECG Cardiette du sous ensemble SE2, après elimination des 5%
des cas les plus extremes (N=35). . . . . . . . . . . . . . . . . . . . . . . . 96
entre les derivations DI, DII et V2 du premier ECG Cardiette et du deuxième
ECG PEM du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . . 96
entre les derivations DI, DII et V2 du deuxième ECG Cardiette et de lECG
PEM associe du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . 97
entre les derivations V1,V3. . . V6 originales et celles synthetisees par le comite de reseaux de neurones generique (ANN-G) et le modèle de regression
generique (REG-G) sur les ECG 2 du sous-ensemble SE2 (N=35). . . . . . 98
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les
comites de reseaux de neurones specifiques (ANN-S) et les modèles de
regression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 98
Comparaison par les t-tests (pairwised et trimmed) de la difference en
termes derreurs RMS obtenues par les comites de reseaux de neurones
et les modèles de regression generiques et specifiques (N=35). . . . . . . . . 99
entre les derivations V1,V3. . . V6 originales des 2ème ECG 12D de SE2 et
celles synthetisees à partir des ECG PEM chronologiquement homologues
par le comite de reseaux de neurones generique (ANN-G) et le modèle de
regression generique (REG-G) (N=35). . . . . . . . . . . . . . . . . . . . . 100
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les
comites de reseaux de neurones specifiques (ANN-S) et les modèles de
regression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 100
Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la
difference en termes derreurs RMS obtenues par les comites de reseaux de
neurones et les modèles de regression generiques et specifiques lorsque les
entrees sont des ECG PEM (N=35). . . . . . . . . . . . . . . . . . . . . . 101
ix
3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises à partir des derivations DI, DII et V2 de lECG 12D Cardiette 2
par le comite de reseaux de neurones generiques (ANN-G) et par le modèle
de regression generique (REG-G). Le logiciel de diagnostic classe les ECG
suivant 4 categories de risque : pas de risque, risque mineur, moyen et majeur.103
3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les modèles de regression specifiques
(REG-S). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits
à partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 104
3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits
à partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 105
B.1 Tableau descriptif des variables et labels de la base de donnees INDANA . 142
Table des figures

1.1
1.2
1.3
1.4
1.5
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
ECG standard 12D : positionnement des electrodes, ondes et intervalles.

Daprès the ECG learning center. http ://medlib.med.utah.edu/kw/ecg . 10
Evolution de lECG au cours dun infarctus. . . . . . . . . . . . . . . . . . 11
Le centre dinteret de linformatique medicale traditionnelle est en train
devoluer des professionnels de sante vers les consommateurs (citoyen/patient).
Daprès Gunther Eysenbach, Consumer health informatics, BMJ 2000. . . . 16
Le projet EPI-MEDICS permet, grace à un système personnel denregistrement de lECG, lorsquun problème est detecte dans lECG dun patient, et
selon le niveau de gravite evalue, de prevenir le medecin du patient et/ou le
service durgence. Les donnees medicales sont alors disponibles sur le Web
et grace à un accès securise, les professionnels de sante peuvent prendre en
charge le patient et orienter correctement ses soins. . . . . . . . . . . . . . 18
Illustration dun des 70 prototypes PEM (Personal ECG Monitor) developpes
dans le cadre du projet EPI-MEDICS pour permettre la detection precoce
des syndromes cardiaques dans un contexte de telemedecine citoyenne. . . 19
Fonctionnement des neurones : chaque neurone m additionne les valeurs de
ses entrees (n1 , n2 , n3 ) multipliees par des poids (W1 , W2 , W3 ), passe le
resultat dans une fonction dactivation, et le renvoie aux neurones qui le
suivent. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Exemples de fonctions dactivation. . . . . . . . . . . . . . . . . . . . . . . 30
Illustration dun reseau de neurones de type perceptron multi-couches. . . . 31
Illustration du fonctionnement du comite de reseaux de neurones unaires/seriels
utilise pour linterpretation de lECG. . . . . . . . . . . . . . . . . . . . . . 39
Comparaison du pouvoir discriminant de deux methodes de classement.
Selon ces deux traces de courbes ROC, la methode A est meilleure que la
methode B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite
obtenu en analyse unaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite
obtenu en analyse serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Comparaison des courbes ROC des differentes methodes en analyse unaire
et serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Schema synoptique du processus decisonnel embarque dans le PEM : a)
sa version actuelle ; b) une future version que nous proposons avec lintroduction dun deuxième score de risque base sur le dossier medical du
patient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
xi
2.10 Illustration dalgorithmes de stratification du risque cardiovasculaire developpes
dans le cadre dEPI-MEDICS. . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.11 Reseau bayesien simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.12 Reseau bayesien bug an 2000. . . . . . . . . . . . . . . . . . . . . . . . . 55
2.13 Meme graphe que Figure 2.12 après moralisation. . . . . . . . . . . . . . . 55
2.14 Meme graphe que Figure 2.12 après triangulation. . . . . . . . . . . . . . . 56
2.15 Larbre de jonction obtenu à partir du reseau bayesien avec les clusters
retenus du processus de triangulation (ovales) et les separateurs induits
(carres). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire. . . . . . . . 63
2.17 Illustration de la structure individuelle des reseaux de neurones utilises
pour estimer le risque cardiovasculaire. . . . . . . . . . . . . . . . . . . . . 64
2.18 Proposition dun modèle decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun système de règles de
logique floue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard

12D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Differents types de modèles de synthèse de lECG 12D à partir dun sousensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et
1 sortie ; (b) reseau global avec 3 entrees, 5 sorties. . . . . . . . . . . . . .
Illustration de la structure individuelle des reseaux de neurones utilises
pour la synthèse de lECG 12D : une couche dentree de 3 neurones (DI,
DII, V2), une couche de sortie de 5 neurones (V1, V3, V4, V5, V6), et h
couches cachees de n neurones. . . . . . . . . . . . . . . . . . . . . . . . . .
Programme dinterpretation automatique de lECG suivant 4 niveaux de
risque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Courbes ROC resultant de la comparaison entre la classification des ECG
derives par reseaux de neurones et par regression, par rapport à la verite
clinique des ECG originaux correspondants. . . . . . . . . . . . . . . . . .
Illustration de lalignement des signaux ECG par correlation croisee. . . . .
Illustration de lapprentissage et de la validation des comites de reseaux de
neurones generiques et specifiques. . . . . . . . . . . . . . . . . . . . . . . .
Visualisation des intervalles de temps utilises pour lapprentissage des comites de reseaux de neurones generiques et specifiques (PT : P-Onset -18
à T-offset +38 msec) et pour tester leur capacite de generalisation (QT :
Q-onset -18 à T-offset +38 msec). En cas dabsence de londe P, on remplace le pointeur P-onset par un pointeur virtuel tel que lintervalle PQ
correspondant à lintervalle PQ moyen. . . . . . . . . . . . . . . . . . . . .
Incidence de la methode de synthèse de lECG sur la calcul des paramètres
ECG de type syntaxique. A gauche sur lECG dorigine, le trace presente
une petite onde R et une grande onde S. A droite, sur lECG de synthèse,
aspect typique dit QS. Londe R, microvoltee, na pas ete detectee et par
consequent la duree de londe Q est passee de 0 à 92 msec et celle de londe
S de 70 msec à 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
76
77
84
86
92
94
95
102
xii
3.10 Illustration de la qualite de synthèse de lECG standard 12D à partir de
lECG PEM 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1
4.2
4.3
4.4
4.5
4.6
Le PEM (Personal ECG monitor) au service de la prevention et la detection

precoce de la survenue devenements cardiovasculaires. . . . . . . . . . . .
Un exemple darchitecture dEPI-MEDICS : un serveur web assure la gestion intelligente des echanges de messages, et des applications clientes distribuees servant à envoyer et à recevoir les demandes XML de tele-expertise
via HTTPS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scenario dalarme majeure. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scenario dalarme moyenne. . . . . . . . . . . . . . . . . . . . . . . . . . .
Grille pervasive au service de la telemedecine. Inspire de David De Roure,
Mobile Medical Monitoring, National e-Science Centre Talk. . . . . . . . .
Scenario dutilisation du module de synthèse dECG. Le cardiologue acquiert un ECG standard 12D du patient, accède via Internet au serveur
dapplication qui, à laide dun service web, reserve les ressources necessaires,
calcule et met à jour les dispositifs de synthèse dECG par reseaux de neurones dans le PEM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
109
110
111
112
116
118
D.1 Ecran de configuration du logiciel SCP-ECG processor. . . . . . . . . . . . 151
Premi`
ere partie
Introduction
Introduction
Contexte
Les maladies cardiovasculaires representent de nos jours la principale cause de mortalite en France et en Europe [1]. Or, la majorite des decès dorigine cardiaque surviennent
dans la phase pre-hospitalière [2, 3, 4, 5]. Une detection precoce des differents cardiopathies permettrait dassurer une prise en charge adequate, dameliorer la qualite de vie des
patients et de reduire le co
ut pour la societe. Il sagit là de lobjectif ultime du projet europeen EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection &
Interpretation of Cardiovascular Syndromes) [6]. Ce projet, qui sinscrit dans le droit fil
de ce que lon appelle aujourdhui la telemedecine citoyenne, propose la creation dun
système intelligent portable et utilisable par tous, le PEM (Personal ECG Monitor),
pour detecter les arythmies et diagnostiquer les infarctus dès lapparition des premiers
symptomes [7]. Moyennant lacquisition dun electrocardiogramme (ECG) par lutilisateur (citoyen/patient), le PEM a pour vocation de stratifier le risque de la survenue dun
evènement cardiovasculaire (arythmie, ischemie), de generer differents niveaux dalarmes
et de transmettre les donnees stockees dans le PEM aux professionnels de sante ou aux
structures durgence concernes.
Pour atteindre ces objectifs, il est necessaire de resoudre une variete de problèmes lies
aux cycles de fonctionnement du système : de lacquisition et lenregistrement de lECG
à linterpretation des donnees recueillies, jusquà lemission et la gestion des alarmes.
Cela impose de concevoir des solutions innovantes à ces problèmes très particuliers lies
à la telemedecine citoyenne et de developper une plateforme logicielle pervasive basee en
grande partie sur des composants embarques dans le PEM.
Parmi les differentes problematiques à resoudre, la plus importante et sans doute la
plus difficile est de rendre le système de decision auto adaptatif en fonction de la specificite
du patient et auto-ameliorant en fonction des eventuelles fausses alarmes ou detections
manquees. Les methodes à mettre en uvre relèvent des domaines de lintelligence artificielle et de laide à la decision (fusion des donnees, logique floue, approche neuronale,
etc.).
Partant dune première solution consistant à interpreter les ECG standards à 12
3
derivations (ECG 12D) au moyen de comites de reseaux de neurones, nous chercherons à
ameliorer lintelligence du système en stratifiant le risque de survenue dun evènement cardiovasculaire en combinant linterpretation de lECG avec lhistorique clinique du patient.
Il sagit en loccurrence dun problème daide au diagnostic consistant à mettre en uvre
des algorithmes (reseaux de neurones, reseaux bayesiens. . . ) resolvant un problème de classement tenant compte de lincertitude sur la situation reelle de lobjet etudie. Considerant
quil nexiste pas dultime methode, nous essayerons de tirer profit des points forts de
chacune des methodes daide à la decision existantes en proposant un modèle hybride,
multi-experts, multi-modules forme dune combinaison de classifieurs et de methodes de
classement pour interpreter lECG du patient, tout en tenant compte des facteurs de
risque (antecedents cardiaques, cholesterol, tabagisme. . . ) propres à lutilisateur concerne
afin de declencher lalarme la plus appropriee.
Une deuxième problematique est de permettre lenregistrement de lECG par lutilisateur avec le minimum dassistance professionnelle, et de rendre cet ECG accessible,
sous un format comprehensible et interpretable, aux professionnels de sante (cardiologue,
medecin traitant). Il est donc imperatif de proposer lutilisation dun système denregistrement simplifie permettant de recueillir lessentiel de linformation spatio-temporelle
contenue dans lECG 12-D avec un nombre minimum delectrodes faciles à placer par le
patient lui-meme. La solution proposee par le projet EPI-MEDICS est denregistrer un
ECG PEM simplifie consistant en 3 derivations pseudo-orthogonales (DI, DII, V2) formant un sous-ensemble de lECG standard à 12 derivations, ramenant ainsi le nombre
delectrodes actives necessaires à lenregistrement de lECG PEM de 9 à 4. Encore fautil, pour une bonne acceptabilite de lapproche EPI-MEDICS par les professionnels de
sante, proposer des moyens permettant de transformer lECG PEM en ECG 12-D, seule
forme delectrocardiogramme que les cardiologues ont lhabitude dinterpreter avec une
très grande precision. Les methodes habituellement utilisees pour synthetiser un ECG
standard 12-D à partir dun nombre reduit delectrodes reposent sur des techniques de
regression lineaire multiple. Nous proposons dans ce memoire une methode de reconstruction non-lineaire originale basee sur lutilisation de reseaux de neurones que nous
validerons sur plusieurs bases de donnees ECG serielles que nous avons selectionne pour
etre le plus representatives possible du type de populations detudes concernees par une
utilisation future du PEM. Notre validation sera realisee tant en termes de contenu informationnel vis à vis de la capacite de detecter un infarctus quen termes de qualite de la
reconstruction des differents echantillons des signaux manquants.
Enfin, nous terminons ce memoire en proposant une architecture de deploiement de
la plateforme decisionnelle du PEM dans le contexte des systèmes dinformation et de
communication pervasifs integrant des serveurs web applicatifs et des grilles de calcul.
Le chapitre 1 est consacre à la presentation du contexte medical de nos recherches : les
maladies cardiovasculaires, et en particulier levocation des causes, des effets et consequences
de linfarctus du myocarde. De meme, nous faisons le point sur les differents moyens de
prevention (facteurs de risque) et de diagnostic (ECG) de linfarctus du myocarde. Ensuite, nous presentons le contexte applicatif de la thèse, à savoir la telemedecine citoyenne
4
et le projet europeen EPI-MEDICS, tout en mettant laccent sur le produit phare du projet : le PEM. Enfin, nous abordons la discipline daide à la decision en medecine et les
principales techniques dintelligence artificielle utilisees en informatique medicale pour
diagnostiquer une pathologie à partir dindicateurs preleves sur le patient (ECG. . . ).
Le chapitre 2 presente la plateforme daide à la decision que nous avons developpee
pour diagnostiquer linfarctus du myocarde. La realisation de cette plateforme est basee
sur une approche multi-modules, multi-experts utilisant des methodes de classement du
domaine de lintelligence artificielle. Elle permet detablir une probabilite de la survenue
de levènement cardiovasculaire à partir de :
Linterpretation de lECG PEM : Cette interpretation est effectuee à laide de comites de reseaux de neurones artificiels sur les ECG enregistres par lutilisateur
lui-meme.
La stratification des facteurs de risque : il sagit destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur les facteurs de risque, les
donnees cliniques, etc. prealablement stockes dans le dossier medical de lutilisateur
du PEM. Nous proposons une solution à base de reseaux bayesiens.
Enfin, pour combiner linterpretation de lECG avec le resultat de la stratification
des facteurs de risque, nous proposons un modèle decisionnel global incorporant les
modules bayesien et neuronal qui collaborent par lintermediaire dun système de
règles de logique floue.
Le chapitre 3 est devolu à la presentation de solutions permettant la reconstruction de
lECG standard 12D à partir de lECG PEM 3D enregistre par lutilisateur du PEM. Lobjectif est de permettre non seulement une detection precise de lischemie, mais egalement
une reproduction la plus fidèle possible des caracteristiques enregistrees par lECG 12D
standard si ce dernier etait enregistre simultanement avec lECG 3D du PEM. Nous proposons deux approches : lune generique visant à construire un module de synthèse applicable
à tout patient, lautre specifique à chaque patient, et des solutions à base de comites de
reseaux de neurones artificiels que nous comparerons à des solutions plus traditionnelles
basees sur la synthèse au moyen de matrices de transformations lineaires obtenues par
regression lineaire multiple.
Enfin, le chapitre 4 est consacre à la presentation des aspects lies au deploiement et
à la maintenance des modules daide à la decision du PEM, en particulier le module
neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes,
ainsi que les strategies de deploiement du module de reconstruction de lECG par comites
de reseaux de neurones.
Deuxi`
eme partie
Aide `
a la d
ecision en m
edecine, le
projet europ
een EPI-MEDICS
Chapitre 1
Maladies cardiovasculaires,
t
el
em
edecine et aide `
a la d
ecision
1.1
Contexte m
edical
Les maladies cardiovasculaires, notamment linfarctus du myocarde1 , comptent parmi
les principales causes de maladie, dinvalidite et de decès en Europe et aux Etats-Unis

et avec le vieillissement des populations, le nombre de decès dorigine cardiaque ira sans
doute en croissant. Or, la majorite des decès dorigine cardiaque surviennent dans la phase
pre-hospitalière [2, 3, 4, 5].
Une detection precoce des premiers symptomes dune cardiopathie permettrait très
probablement dassurer une meilleure prise en charge et en consequence adequate, dameliorer
la qualite de vie des patients et de reduire le co
ut pour la societe.
Plusieurs etudes epidemiologiques ont en effet montre limpact potentiel en termes
de mortalite et de morbidite cardiaque dune diminution de la duree entre lapparition
des symptomes et la prise en charge effective des patients [2]. Quand importe plus
que o`
u [3]. Il faudrait en pratique arriver à reduire le temps separant lapparition des
symptomes et le debut des traitements à moins de deux heures contre quatre en moyenne
actuellement. Or comme on va le voir ci-après, le problème nest pas simple. Meme les
meilleurs experts se trompent parfois. Et lischemie cardiaque peut etre instable : presente
au domicile du patient, elle peut avoir disparu à larrivee au service des urgences, pour
reapparatre quelques heures après quand le patient est revenu à domicile. Do`
u linteret
des solutions de telemedecine citoyenne telles que celles proposees par EPI-MEDICS que
nous evoquons dans la dernière partie de ce chapitre.
1
Linfarctus du myocarde est la consequence dune occlusion coronaire brutale. Cela declenche une
ischemie myocardique regionale sevère qui, si elle se perennise, engendre des lesions cellulaires irreversibles.
Chapitre 1. Maladies cardiovasculaires, telemedecine et aide à la decision
1.1.1
Le diagnostic
Le diagnostic de linfarctus du myocarde sappuie sur la mise en evidence de consequences

cliniques et biologiques [8, 9, 10, 11, 12].
Le diagnostic clinique
Le symptome classique de linfarctus du myocarde dans sa forme typique est la douleur thoracique. Cette douleur dure au moins 20 minutes, elle est violente, parfois insupportable. Elle irradie souvent aux membres superieurs vers le bord cubital, la machoire
inferieure. Elle peut egalement irradier vers lepigastre, mais jamais en dessous de lombilic.
Linfarctus du myocarde debute presque toujours sans cause declenchante evidente,
avec un horaire dapparition predominant dans les heures de la matinee, mais pouvant
setaler sur lensemble des 24 heures. Il peut apparatre au cours dun effort physique, par
exemple sportif ; dans ce cas larret de leffort ne permet pas de le faire ceder. La douleur
peut etre absente, la symptomatologie peut alors se limiter à des signes digestifs (nausees,
vomissement, gene epigastrique, etc.).
Le diagnostic biologique
Les lesions cellulaires causees par linfarctus entranent une perte detancheite membranaire, voire une lyse de la membrane cellulaire. Il en resulte une liberation de molecules
intra-cytoplasmiques. Dès lors des enzymes myocardiques (la myoglobine, la myosine, etc.)
seront retrouvees dans le sang peripherique, et peuvent y etre reperees via une analyse
biologique.
1.2
L
electrocardiologie quantitative
Le diagnostic precoce de linfarctus nest pas chose facile. Les douleurs thoraciques
peuvent avoir dautres causes que linfarctus, et certains episodes ischemiques sont silencieux, notamment en cas de diabète. Le seul element daide à la decision objectif et facile
à mettre en uvre en situation pre-hospitalière pour faire le diagnostic dun evenement
cardiaque et de sa severite (angine de poitrine, infarctus aigu, risque de decès, etc.) et
pour guider les traitements est lelectrocardiogramme (ECG) [13].
LECG est une representation de lactivite electrique du coeur enregistree par
des electrodes placees sur la surface du corps. Les differents modes denregistrements
electrocardiographiques se distinguent par le nombre et la nature des derivations utilisees

ainsi que par les eventuelles transformations lineaires qui leur sont appliquees. Les deux
techniques dinvestigations les plus repandues actuellement sont :
lECG 12D (12 derivations)
lECG 3D, ou le vectocardiogramme (VCG)
Nous ne traitons pas le VCG dans ce rapport, car son utilisation est très peu repandue.
1.2.1
LECG standard 12D
LECG standard comporte 12 derivations (Figure 1.1) respectivement enregistrees

dans le plan frontal et selon des directions parallèles au plan horizontal (derivations
precordiales).
Les six derivations frontales sont habituellement identifiees comme suit :
DI : mesure de la difference de potentiel (DDP) bipolaire entre le bras droit et le
bras gauche.
DII : mesure de la DDP bipolaire entre le bras droit et la jambe gauche.
DIII : mesure de la DDP bipolaire entre le bras gauche et la jambe gauche.
aVR : mesure du potentiel unipolaire augmente du bras droit.
aVL : mesure du potentiel unipolaire augmente du bras gauche.
aVF : mesure du potentiel unipolaire augmente de la jambe gauche.
DIII, aVR, aVL et aVF peuvent etre calcules à partir de DI et DII comme suit :
1. DIII = DII - DI
2. aVR = -0.5(DI+DII) =
3. aVL = DI - 0.5DII =
4. aVF = DII - 0.5DI =
3
2
3
2
3
2
VR
VL
VF
Les six derivations precordiales sont definies comme suit :

V1 mesure le potentiel unipolaire de lelectrode V1 situee sur le 4ème espace intercostal droit, à droite du sternum.
V2 mesure le potentiel unipolaire de lelectrode V2 sur le 4ème espace intercostal
gauche, au bord gauche du sternum.
V3 est situee entre V2 et V4.
V4 est situee sur le 5ème espace intercostal gauche, sur la ligne medioclaviculaire.
V5 est situee sur le 5ème espace intercostal gauche, sur la ligne axillaire anterieure.
V6 est situee sur le 5ème espace intercostal gauche, sur la ligne axillaire moyenne.
Les potentiels unipolaires V1-V6 et VR, VL, VF sont obtenus en mesurant la DDP
entre chacune des electrodes concernees et la borne controle de Wilson qui est le potentiel
moyen de VR, VL et VF.
1.2.2
LECG : les diff

erentes ondes et les intervalles de temps
LECG est le temoin direct de differentes phases cycliques (Figure 1.1), indiquant les
grandes etapes de lactivation electrique du coeur :
la depolarisation des oreillettes : onde P
la depolarisation des ventricules : onde QRS
la repolarisation des ventricules : onde T
Les intervalles de temps generalement consideres sont, outre la duree de QRS :
la duree dune depolarisation et repolarisation ventriculaire : intervalle QT
la duree dun cycle ventriculaire complet : intervalle RR
la duree dun cycle atrial complet : intervalle PP
1.2.3
LECG, outil de d
etection du dysfonctionnement cardiaque
De nos jours, LECG est considere comme un moyen fiable, non-invasif, de faible
co
ut, et surtout de detection precoce dun nombre considerable danomalies cardiaques
(infarctus, arythmie, etc. ) qui depasse de loin les techniques dimagerie habituelles. En
plus, lapport technologique a ouvert une nouvelle ère de lexploration du champ electrique
cardiaque baptisee lelectrocardiologie quantitative, ou numerique.
Linfarctus du myocarde vu de lECG

Linfarctus du myocarde commence par une reduction, voir une rupture, brutale de
lapprovisionnement sanguin dune region du coeur. Ensuite une serie devenements est
declenchee en commencant par une ischemie sous-endocardique2 ou transmurale, suivie de
la necrose3 , et la fibrose si lapprovisionnement sanguin ne retourne pas à la normale dans
un delai approprie. Les variations de lECG refletant cet ordre suivent habituellement
un modèle bien connu selon la localisation et la gravite de linfarctus. En general, plus
le nombre de derivations detectant un infarctus est grand, plus grave est le pronostic.
Levolution classique dun infarctus du myocarde vu à travers lECG comporte les etapes
suivantes (en supposant que lECG precedant linfarctus etait normal, Figure 1.2A) :
augmentation de lamplitude et de la largeur de londe T ; dans certains cas, apparition dun sus-decalage du segment ST (Figure 1.2B)
sus-decalage du segment ST (ST-elevation) accompagne dune certaine variation de
londe T (Figure 1.2C)
2
Lischemie sous-endocardique se traduit, sur lelectrocardiogramme, par une onde T exagerement

positive
3
Degenerescence des cellules et des tissus attribuable à un defaut de vascularisation qui empeche une
irrigation sanguine normale
10
Fig. 1.1 ECG standard 12D : positionnement des electrodes, ondes et intervalles. Daprès
the ECG learning center. http ://medlib.med.utah.edu/kw/ecg
11
apparition dune onde Q, diminution du sus-decalage du segment ST, ainsi quune

inversion de londe T, ce qui correspond à une necrose (Figure 1.2D)
onde Q et inversion de londe T, ce qui correspond à la fois à une necrose et une
fibrose (Figure 1.2E)
onde Q et normalisation de londe T (fibrose) (Figure 1.2F)
Fig. 1.2 Evolution de lECG au cours dun infarctus.

Les Crit`
eres ESC de diagnostic de linfarctus
En ao
ut 2000, la Societe Europeenne de Cardiologie (ESC) a publie un document
consensuel repertoriant les critères à utiliser pour faire un diagnostic de linfarctus aigue du
myocarde [14]. La liste des changements observes sur lECG indiquant une ischemie myocardique susceptible devoluer en infarctus de myocarde est etablie comme suit :
Patients avec sus-decalage du segment ST 0.2 V dans au moins 2 derivations
contigues des derivations V1, V2, et V3, ou 0.1 V dans les autres derivations.
12
Patients sans sus-decalage du segment ST mais avec une depression du segment ST

ou/et des anomalies de londe T dans au moins 2 derivations contigues, en plus dune
inversion symetrique de londe T presente dans au moins 2 derivations contigues.
Laffinement regulier des critères de diagnostic de linfarctus et la decouverte et la
mise au point de nouveaux marqueurs biologiques, electriques. . . permet à chaque fois
un meilleur depistage des patients à risque dinfarctus. Neanmoins, le problème nest
pas complètement resolu : le nombre de faux negatifs (detections manquees) est encore
significatif.
En effet, dans une etude publiee en 1993, McCarthy et al [15] ont montre quau moins
25% des patients qui avaient un infarctus du myocarde ont ete renvoyes de lhopital sans
traitement à cause dune sous-estimation du sus-decalage du segment ST. De meme, 80%
des patients admis dans des unites de soins coronariens consecutivement à des indications
suggerant un infarctus du myocarde sont renvoyes sans pouvoir confirmer un diagnostic
dinfarctus [16, 17]
Plus recemment, en 2000, Pope et al. [18] ont etudie lincidence des facteurs lies au sexe,
race, absence des caracteristiques habituelles des ischemies cardiaques. . . sur lincapacite
de detecter une ischemie cardiaque chez des patients admis à lhopital pour suspicion
dischemie. Sur la population detude de plus de 10000 patients (889 patients avec un
infarctus aigu et 966 patients avec une angine de poitrine instable), 2.1 % des patients
avec un infarctus et 2.3 % avec une angine instable nont pas ete detectes. En plus, les
patients qui avaient une ischemie cardiaque mais qui etaient :
de sexe feminin de moins de 55 ans (odds ratio4 de 6.7),
non-blancs (odds ratio de 2.2),
se plaignant dun souffle court (odds ratio de 2.7),
ou ayant un ECG normal (odds ratio de 3.3),
etaient moins susceptibles detre detectes et par la suite hospitalises. De meme, selon cette
etude, les patients avec un infarctus aigu qui etaient :
non-blancs (odds ratio de 4.5),
ou ayant un ECG normal (odds ratio de 7.7),
etaient moins susceptibles detre hospitalises. De plus, seulement 410 des 1445 patients
ayant une ischemie myocardique presentaient sur leur ECG recueilli lors de leur admission
au service des urgences, les critères ECG standards de presence dune ischemie. Enfin, les
etudes qui ont suivi [19], [20], . . . ont confirme ces constatations et reaffirme linteret
majeur de continuer à affiner les critères de diagnostic de linfarctus. Do`
u linteret du
travail presente dans ce memoire qui vise à mettre au point un procede intelligent de
surveillance medicale à la portee du grand public permettant de detecter les patients
à risque dès la survenue dun evenement cardiaque, nimporte o`
u, nimporte quand, à
4
un odds ratio est le rapport entre la probabilite de contracter la maladie en presence de certains
facteurs ou caracteristiques et la probabilite de la contracter dans le cas contraire. Un odds ratio de 4
signifie quune personne ayant la caracteristique à letude est quatre fois plus susceptible detre affectee
que quelquun qui ne les presente pas, tandis quun odds ratio de 0,5 signifie quelle lest moitie moins.
13
domicile, au travail, ou en ambulatoire, en combinant analyse automatique dun ECG

simplifie et prise en compte du contexte clinique du patient.
Lanalyse et linterpr
etation automatique des ECG
Lavènement de lECG numerique et le developpement de linformatique ont rendu
possible lanalyse et linterpretation automatique des ECG.
Les premiers travaux remontent au debut des annees 60. Mais lECG nest devenu
veritablement numerique quavec lapparition des microprocesseurs au milieu et à la fin
des annees 70. Aujourdhui au moins 90% des electrocardiographes vendus aux Etats
Unis ou en Europe incluent un module danalyse et dinterpretation automatique des
ECG. Il sagit, à notre connaissance, dune des rares applications medicales pour laquelle
les systèmes experts sont sortis des laboratoires de recherche et sont utilises en routine
clinique dans des environnements differents de leur lieu dorigine. Ceci na ete rendu
possible que grace à une action de recherche internationale concertee qui a dure plus de
15 ans et a permis de constituer differentes bases de donnees permettant de valider les
algorithmes danalyse et dinterpretation automatique de lECG, laction CSE Common
Standards for quantitative Electrocardiography [21].
Typiquement, un outil informatique danalyse automatique de lECG consiste en un
ensemble de modules permettant lacquisition du signal, lanalyse et linterpretation du
rythme, la detection dun complexe QRS type, la reconnaissance des differentes ondes,
lextraction dun ensemble de paramètres destines à caracteriser le signal et son affectation
à une ou plusieurs classes de diagnostic, cest à dire realisant les differentes etapes de ce
que lon appelle plus communement une reconnaissance de formes.
Lapproche traditionnelle est principalement basee sur des descripteurs morphologiques et temporels du signal familiers aux cliniciens tels que la presence ou labsence
dune onde Q, le rapport de R/S. . . La deuxième approche extrait des descripteurs quantitatifs au moyen doutils mathematiques tels que la transformee de Fourier, lanalyse
en ondelettes, etc. Ces descripteurs sont par la suite utilises par des methodes issues de
lintelligence artificielle (analyse discriminante, reseaux de neurones, logique floue, ou des
systèmes à base de règles) pour realiser une interpretation automatique de lECG [22].
Plusieurs dizaines de systèmes danalyse automatique de lECG ont ete developpes
[23], mais très peu ont ete experimentes en milieu hospitalier, dont notamment le système
danalyse et dinterpretation automatique des ECG/VCG connu sous le nom de Système
de Lyon. Ce système permet lenregistrement dECG 12D ou de VCG, la determination
du complexe QRS type à laide dun algorithme de classification non hierarchique, et
realise linterpretation automatique du contour grace à une approche de type heuristique
mettant en uvre des logiques ternaires (algèbre de Post) [24]. Plus recemment, dautres
systèmes bases sur des methodes issues de lintelligence artificielle (logique floue, systèmes
14
experts, reseaux de neurones, etc.) ont ete developpes et commencent à etre implantes en
milieu hospitalier, en ambulatoire ou à domicile [7].
Analyse unaire vs analyse s

erielle La plupart des programmes dinterpretation automatique de lECG evoques ci-dessus realisent ce que lon appelle une analyse unaire,
cest à dire quils analysent un seul ECG par patient sans tenir compte des autres ECG
eventuels du patient. Cependant, malgre linteret suscite par lanalyse unaire de lECG
au cours des dernières decennies et la multitude de methodes qui ont dejà vu le jour, la
performance des programmes automatises bases sur lanalyse unaire est encore limitee.
La precision diagnostique globale ne depasse guère le chiffre de 80 % [25]. Le constat doit
etre tempere par le fait que la precision diagnostique des meilleurs cardiologues lorsquils
ont à leur disposition un seul ECG est elle meme limitee à environ 82-83%.
Ceci est imputable au fait que lapproche unaire ne prend pas suffisamment en compte
la specificite du patient. La tendance au cours de ces dernières annees fut donc de
developper des systèmes danalyse dite serielle [22, 26, 27, 28, 29] o`
u le patient est
considere comme sa propre reference. Linterpretation de lECG concerne est alors etablie
en termes devolution par rapport aux enregistrements precedents. Cette tendance vaut
aussi pour linterpretation humaine. Dans un recent document consensuel de lACC/AHA
(American College of Cardiology/American Heart Association) [13], les cardiologues sont
eux aussi incites à ameliorer leur interpretation de lECG en le comparant par rapport à
un ECG de reference. En dautres termes, il faut tenir compte de levolution serielle des
ECG.
1.3
1.3.1
La t
el
em
edecine citoyenne : le projet EPIMEDICS
Introduction
Levolution technologique dans le secteur des communications est en voie de

revolutionner les relations entre les individus et les collectivites. De facon plus specifique,
lavènement des nouvelles technologies de linformation et des telecommunications (NTIC)
permet denvisager de nouvelles facons dexercer la medecine, et doffrir des services
medicaux specialises ou ultraspecialises dans des environnements (à domicile, en ambulatoire, etc.) qui, jusquà maintenant, nont pu en beneficier. Il sagit de la telemedecine
ou medecine dite à distance. La telemedecine se definit comme etant lunion des
telecommunications et de la medecine [30, 31]. Elle consiste à utiliser les nouvelles technologies de linformation pour [32] :
effectuer des consultations à distance : teleconsultation (par exemple, transmission
dECG à un autre etablissement pour avis sans necessairement transferer le patient)
15
[33],
interpreter des donnees medicales à distance : teleexpertise (par exemple, interrogation dun specialiste en lui transmettant les donnees sur le patient pour un diagnostic
complementaire) [34, 35],
ou assurer une surveillance à domicile des patients : telesurveillance (par exemple,
suivi des personnes agees à domicile [36, 37], suivi dune grossesse à risque, etc.).
1.3.2
Evolution : pass
e, pr
esent et futur
La mise en uvre darchitectures de telemedecine necessite la prise en compte des

elements suivants : des reseaux ouverts, des bases de donnees medicales, des moyens de
representation et dechange de donnees biomedicales numeriques, des outils et des interfaces de communication multi-acteurs et multimedias, des algorithmes de detection
immediate danomalies, des outils et des interfaces de representation dynamique des
donnees. De nombreux projets europeens, dans le cadre des programmes AIM (Advanced
Informatics in Medicine) et Health Telematics ont permis de realiser des avancees significatives dans ce domaine en creant de nouveaux concepts et des standards à chaque niveau
de cette architecture [38, 39, 40, 41].
Ainsi, en cardiologie, une première etape, sans doute la plus fondamentale pour louverture des systèmes dinformation medicale au benefice de la Sante Publique, a ete la
conception et limplementation du protocole de communication standard SCP-ECG (Standard Communications Protocol for Computerized Electrocardiography) [42, 43, 44]. Ce
protocole propose un standard universel pour lechange de donnees ECG (contenu et format des donnees), donne des directives pour lencodage des signaux ECG, et inclut aussi
un protocole de transport approprie, le tout base sur le modèle OSI. Une deuxième etape
a ete le developpement dun modèle conceptuel de reference pour larchivage des donnees
electrocardiographiques pouvant etre transmises via le protocole SCP-ECG, et compatible
avec toutes les options de ce dernier. Ce modèle est lun des resultats majeurs du projet DIPE (Open European Data Interchange and Processing for Electrocardiography,
1992-1995) [45, 46].
Mais le contexte societal actuel est en train de changer. Du fait du vieillissement des
populations. . . , on soriente de plus en plus vers des approches de type soins à domicile
et de self-care et plus generalement vers la telemedecine citoyenne.
La principale consequence est une reorientation fondamentale des centres dinteret de
linformatique medicale qui ne sont plus focalises sur les professionnels de sante mais sur
les consommateurs (citoyens/patients) (Figure 1.3). Le patient devient lacteur principal
du système à linstar dEPI-MEDICS o`
u le patient enregistre ses propres ECG et documente ses propres symptomes. Cette evolution est favorisee par une utilisation de plus
en plus frequente de systèmes embarques intelligents et communicants et la federation de
differents faits et acquis issus de la recherche : lutilisation des systèmes dinformation, le
16
Fig. 1.3 Le centre dinteret de linformatique medicale traditionnelle est en train

devoluer des professionnels de sante vers les consommateurs (citoyen/patient). Daprès
Gunther Eysenbach, Consumer health informatics, BMJ 2000.
17
developpement dinfrastructures de communication pervasives, mobiles et faciles à utiliser, la miniaturisation la plus importante possible des microcomposants, la baisse de leur
co
ut et laugmentation de leurs performances, et la construction de systèmes de gestion
bases sur le contexte et des interfaces naturelles et personnalisees.
Un exemple type de cette evolution vers la telemedecine citoyenne est le projet EPIMEDICS, que nous presentons brièvement ci-après.
1.3.3
EPI-MEDICS
Le projet EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection
& Interpretation of Cardiovascular Syndromes) (Figure 1.4) a deux objectifs principaux
[47] :
detecter, aussitot que possible, le debut dune ischemie ou dune arythmie en enregistrant les changements des ECG des patients à risque,
impliquer sans delai, mais seulement si necessaire, les structures de sante.
Pour realiser ces objectifs et en particulier pour detecter de manière precoce les dysfonctionnements cardiaques dès lapparition des premiers symptomes, à domicile ou en
ambulatoire, EPI-MEDICS a developpe un moniteur personnel dECG (PEM : Personal
uteux, de petite taille, intelligent et facile dutilisation,
ECG Monitor) (Figure 1.5) peu co
dote dun serveur embarque et dun composant metier danalyse quantitative de lECG.
Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des
informations spatio-temporelles produite par lactivite du cur et denvoyer via Bluetooth
et GPRS ou UMTS differents types de messages ou dalarmes convoyant des ECG et un
mini-dossier medical de lutilisateur aux services de sante concernes, grace à des telephones
portables de 2ème ou 3ème generation. Le seul equipement requis pour les professionnels
de sante est une connexion Internet. Tous les messages du patient aux medecins sont ecrits
en XML [48] et encapsulent les donnees des ECG suivant le standard SCP-ECG. Ce mode
de fonctionnement est cense faciliter lacceptation du PEM par les professionnels de sante
et devrait permettre une très large diffusion de ce concept.
Le système de decision embarque dans le PEM comporte quatre sous-ensembles :
detection des arythmies 5 , des ischemies 6 , generation dalarmes et de leur niveau prenant
si possible en consideration des informations cliniques telles que les facteurs de risque du
patient, gestion de lenvoi des alarmes tenant compte des non-reponses eventuelles des
serveurs dalarme ou des professionnels de sante contactes, etc.
5
Derèglement dans le système de conduction electrique du coeur (rythme trop lent lorsquil sagit de
bradycardie ; ou trop rapide, on parle alors de tachycardie) pouvant entraner des consequences plus ou
moins graves : etourdissements, nausees, vertiges, palpitations, douleurs, etc.
6
Arret ou insuffisance de la circulation sanguine dans une partie du corps ou un organe, qui prive les
cellules dapport doxygène et entrane leur necrose. Les infarctus sont consecutifs à des ischemies.
18
Fig. 1.4 Le projet EPI-MEDICS permet, grace à un système personnel denregistrement

de lECG, lorsquun problème est detecte dans lECG dun patient, et selon le niveau de
gravite evalue, de prevenir le medecin du patient et/ou le service durgence. Les donnees
medicales sont alors disponibles sur le Web et grace à un accès securise, les professionnels
de sante peuvent prendre en charge le patient et orienter correctement ses soins.
19
Fig. 1.5 Illustration dun des 70 prototypes PEM (Personal ECG Monitor) developpes
dans le cadre du projet EPI-MEDICS pour permettre la detection precoce des syndromes
cardiaques dans un contexte de telemedecine citoyenne.
La realisation de la plateforme decisionnelle du PEM na ete rendue realisable que
grace à lapport de differentes techniques dintelligence artificielle automatisant les processus daide à la decision implementes dans le PEM. Tous ne sont dailleurs pas encore
operationnels. Seuls ont ete experimentes sur le terrain une première version des modules
de detection darythmies et dischemie et de generation des alarmes. Leur optimisation
et plus particulièrement la prise en compte des informations cliniques pour ameliorer la
decision constituent justement lun des principaux apports de ce memoire.
Dans la suite de ce chapitre, nous exposerons brièvement levolution de laide à la
decision en medecine, en mettant laccent sur les systèmes daide à la decision et en general
les principales methodes developpees dans le cadre de cette discipline. Dans le chapitre
2, nous presenterons en detail les techniques que nous avons adoptees pour concevoir les
modules decisionnels susceptibles detre integres dans la plateforme daide à la decision
du PEM : le module dinterpretation de lECG et celui de la stratification des facteurs de
risque. Enfin, dans le chapitre 4, nous presenterons les aspects lies au deploiement de ces
modules daide à la decision, des modules de gestion et denvoi dalarme, . . . qui ont ou
qui vont etre installes dans le PEM.
1.4
1.4.1
20
Laide `
a la d
ecision en m
edecine
G
en
eralit
es
La medecine est une discipline qui requiert une prise de decision. Ce processus resulte
de la confrontation dun problème reel à lexperience acquise (savoir-faire) et à un corpus
de connaissances theoriques (savoir) dans le but deffectuer un choix. La difficulte de la
prise de decision en medecine vient de la situation dincertitude, qui tient à plusieurs
raisons :
lincertitude sur les connaissances : certaines connaissances sont dordre statistique
et sont associees par nature à un risque derreur, mais dautres connaissances sont
incomplètes, par defaut dexploration ;
lincertitude sur les faits : la description de letat present nest jamais parfaite, soit
par manque de moyens ou de temps (urgence), soit par defaut de mesure ou mauvaise
interpretation dun symptome, dun signe ou dun resultat ;
lincertitude du langage : le flou et lambigute des notions manipulees perturbent
le traitement et la transmission de linformation.
1.4.2
Les syst`
emes daide `
a la d
ecision
Les avancees de linformatique et plus particulièrement lavènement des systèmes dinformation, les bases de donnees, les dossiers informatises, etc. ont facilite la prise de
decision medicale en ameliorant laccès aux donnees pertinentes. Neanmoins, il ne sagit
là que dune aide indirecte facilitant laccès aux presentations des faits sur lesquels le praticien doit appliquer un raisonnement. Les systèmes daide à la decision vont beaucoup
plus loin : ils ont lambition dassister lhomme, et dans certaines situations, en particulier à domicile ou en ambulatoire, à le suppleer en remplacant ou en reproduisant le
raisonnement humain [49].
Caract
eristiques
Plusieurs caracteristiques permettent de decrire les systèmes daide à la decision suivant le type de problème à resoudre, le mode dintervention, la nature de linteraction, ou
enfin la technique employee.
Applications
Les systèmes daide à la decision peuvent sappliquer à deux types de problèmes :
21
un problème de diagnostic (par exemple, categoriser un ECG en normal ou suspect)

dans le but de separer ce qui est de ce qui nest pas, compte tenu de lincertitude
sur la situation reelle de lobjet detude ;
un problème doptimisation dans le but dindiquer la demarche la plus efficace (par
exemple, une strategie therapeutique) compte tenu de lobjectif et des contraintes
(co
ut, risque, difficulte, environnement).
Fonctionnement
Plusieurs modes de fonctionnement sont possibles :
le mode passif suppose lintervention explicite et directe de lutilisateur pour decrire
le problème (par exemple, letat du patient) et interroger le système.
le mode semi-actif correspond à un système dont le declenchement automatique
repond à une intervention humaine (par exemple, le système dalarme qui alerte sur
un changement detat du patient, comme dans le cadre dEPI-MEDICS).
le mode actif est celui dun système à declenchement automatique et autonome (par
exemple, un système de telesurveillance).
1.4.3
Les principales approches utilis

ees pour laide `
a la d
ecision
Les methodes utilisees pour laide au diagnostic relèvent toutes de la reconnaissance de

formes. Des centaines darticles et de livres ont ete ecrits sur le sujet [50]. Les principales
approches sont : lapproche statistique, syntaxique, les systèmes à base de connaissances,
les reseaux de neurones. Il nest pas dans notre objectif de presenter en detail lensemble
des methodes developpees par le passe, mais juste celles qui nous semblent les plus pertinentes dans notre contexte applicatif. On trouvera une revue de detail des differentes
methodes dans larticle de synthèse de Jain et al [51] qui insistent en outre sur limportance de la phase dextraction des caracteristiques qui precède la reconnaissance de formes
elle-meme et montrent linteret de combiner plusieurs classifieurs.
Approche neuronale
Il sagit de methodes inspirees des structures neuronales et du fonctionnement cerebral,
do`
u le nom frequent de reseau de neurones artificiels [52].
Le reseau neuronal est un programme qui met en jeu des neurones relies entre eux par
des connexions. Chaque neurone realise la sommation des stimuli des neurones afferents,
chaque connexion etant affectee dune ponderation. Cette sommation obeit à differentes
formes de fonctions, dites de transfert ou dactivation (tout ou rien, fonction en escalier,
22
sigmode. . . ), et si le resultat depasse un certain seuil dactivation, alors le neurone envoie

un stimulus aux neurones afferents.
Approche statistique
Lapproche statistique [53] concerne essentiellement les methodes de regression ou
de classement multidimensionnelles qui permettent dexpliquer la valeur dune reponse ou
lappartenance à un groupe en fonction des valeurs de plusieurs variables dites explicatives.
Il sagit notamment de lanalyse discriminante, de la regression logistique dans le cas
dune reponse qualitative, de la regression multiple dans le cas dune reponse quantitative,
ou du modèle de Cox dans le cas dune variable de reponse censuree (analyse de survie).
Ces methodes repondent à deux objectifs : reduire le nombre souvent considerable de
variables potentiellement explicatives à un sous-ensemble dusage et obtenir dune manière
plus aisee une equation predictive.
Etant probablement la methode statistique de classement la plus utilisee, lanalyse
discriminante lineaire est une methode de reconnaissance de formes statistique basee sur
une technique dapprentissage supervise, très facile à mettre en uvre [54]. Le but est
de determiner la classe dune observation en calculant la distance de Mahalanobis entre
lobservation et le centre de chacune des classes et en affectant lobservation à la classe
pour laquelle la distance de Mahalanobis est minimale.
Le modèle est etabli à partir dun un ensemble dobservations (ensemble dapprentis` partir de cet ensemble dapprentissage,
sage) pour lesquelles les classes sont connues. A
lanalyse discriminante etablit un ensemble de fonctions lineaires des facteurs predictifs,
connues sous le nom de fonctions discriminantes, du type :
Y = v1 X1 + v2 X2 + . . . + vn Xn + C
(1.1)
o`
u les vi sont des coefficients discriminants, les xi sont les variables dentree (les facteurs
predictifs) et le C est une constante.
Ces fonctions discriminantes sont employees pour prevoir la classe dune nouvelle observation. Pour un problème de classement avec k classes, k fonctions discriminantes sont
construites. Etant donnee une nouvelle observation, toutes les fonctions discriminantes
sont evaluees et lobservation est assignee à la classe i si la ième fonction discriminante a
la valeur la plus elevee.
23
Approche probabiliste
Lapproche probabiliste, reposant sur lapplication du theorème de Bayes, permet de
calculer la probabilite dune maladie connaissant les signes du malade. Lapplication sur
un problème de diagnostic medical du theorème de Bayes etablit que la probabilite a
posteriori dun diagnostic Di , lorsque le signe S est present, est fonction de la probabilite
a priori du diagnostic et de la probabilite conditionnelle dobserver le signe lorsque le
diagnostic est present :
P (Di /S) =
P (Di ) P (S/Di )
P (Di ) P (S/Di )
= P
P (S)
( j P (Dj )P (S/Dj ))
(1.2)
La methode bayesienne tient compte des signes positifs et negatifs et permet de calculer
le diagnostic le plus probable [55]. La determination des probabilites a priori (incidence
de la maladie) et des probabilites conditionnelles (frequence dun signe dans une maladie) suppose lexploitation dune base de donnees medicales enregistrant les signes et le
diagnostic de chaque cas.
Approche symbolique
Il sagit essentiellement des systèmes dits experts [56] qui sont des logiciels de
resolution de problèmes, qui permettent de representer sous forme explicite et declarative
les connaissances et le comportement dun expert humain, afin quil puisse etre reproduit
par un programme. Les limites de cette approche tiennent aux contraintes de formulation
de la connaissance (connaissance imparfaite, relations multiples, difficulte de formalisation
du raisonnement, contrainte du dialogue avec lutilisateur, necessite de consensus).
1.4.4
Conclusion
Laide à la decision est une discipline qui a suscite beaucoup dinteret au cours des
dernières decennies et enormement de methodes ont dejà vu le jour. Cependant, aucune
methode ne sest imposee comme etant la methode de reference et la tendance au cours
de ces dernières annees fut lessor des systèmes hybrides o`
u les resultats de plusieurs
methodes daide à la decision sont combines. En effet, à linstar des systèmes multi-experts
o`
u la combinaison des interpretations de plusieurs experts est plus performante que celle
de chacun des experts pris individuellement [25], la combinaison des resultats de plusieurs
classifieurs (comites de reseaux de neurones) conduit à des resultats de meilleure qualite
que ceux du meilleur classifieur (meilleur reseau de neurones du comite) [57]. De meme,
la combinaison des resultats de plusieurs methodes de classement (fusion de donnees
via des heuristiques entre un comite de reseaux de neurones et un reseau bayesien) sera
probablement plus performante que nimporte quelle methode consideree individuellement
24
[58]. Cest ce concept que nous allons developper dans le prochain chapitre : Aide à la
decision en telecardiologie.
Troisi`
eme partie
Conception, validation et strat
egies
de d
eploiement de la plateforme
d
ecisionnelle dEPI-MEDICS
25
Chapitre 2
Aide `
a la d
ecision en t
el
ecardiologie
2.1
Contexte et objectifs
Comme dejà indique dans lintroduction de ce memoire, lobjectif principal dEPIMEDICS est de permettre la detection precoce de linfarctus du myocarde dès lapparition des premiers symptomes afin de pouvoir intervenir rapidement et administrer un
traitement immediat et efficace.
Dans ce contexte, lECG, grace à son caractère non-invasif, sa rapidite de mise en
uvre, et son faible co
ut reste un examen objectif de choix. Cependant, comme evoque
dans le chapitre 1, sa performance diagnostique reste limitee. Ainsi Pope et al [18] ont
montre quen pratique clinique lorsque lon applique les critères ECG classiques de diagnostic de linfarctus, au moins 25% des patients qui avaient un infarctus du myocarde
ne sont pas diagnostiques et sont renvoyes de lhopital sans traitement. Sans doute de
nouvelles methodes de reconnaissance de forme combinees à de nouvelles methodes de
traitement du signal (analyse en ondelettes, etc.) pourront elles permettre dameliorer
ces performances. Les resultats de laction CSE ont montre en effet que les meilleurs
programmes danalyse automatique de lECG sont aussi performants que les meilleurs
cardiologues [25]. Mais il faut savoir aussi que la performance des cardiologues est accrue
lorsquils connaissent le contexte du patient. En effet, de nombreuses etudes [59, 60, 61, 62]
ont montre que lanalyse de lECG combinee avec lhistorique clinique et les resultats des
dernières analyses medicales du patient est le meilleur moyen pour effectuer un diagnostic precoce de linfarctus du myocarde, en particulier dans un contexte durgence ou en
ambulatoire.
La principale problematique est donc de pouvoir trouver la meilleure solution pour
fusionner des donnees de nature differente (dichotomique, categorique et continue), en
provenance de sources diverses (ECG, donnees cliniques,. . . ) afin detablir un score de
risque et declencher une alarme appropriee. Or ce domaine de la fusion de donnees est
devenu particulièrement important pour un grand nombre dapplications tels que la ro-
Chapitre 2. Aide à la decision en telecardiologie
27
botique, linterpretation dimage ou dans notre contexte, la telemedecine. De nombreuses

approches ont ete developpees afin dassurer une combinaison optimale des donnees. Aussi
Jeanpierre et al. [63] et Bellot et al. [64] ont developpe une approche de fusion de donnees
dans le cadre dune application de telemedecine. Il sagit du projet Diatelic qui a pour
objectif dassister à domicile des personnes souffrant dinsuffisance renale à travers un
recueil regulier de donnees auprès patient (poids, tension, temperature,. . . ) à laide de
capteurs. Ces donnees, heterogènes, incertaines et bruitees sont fusionnees au sein dun
reseau bayesien dynamique afin de pouvoir etablir un diagnostic. Enfin, pour passer dune
mesure absolue (poids du patient) à une mesure relative prenant en compte la specificite
du patient, on fait appel à des operateurs de logique floue.
Mettre au point de nouvelles methodes de fusion de donnees dans le domaine de
la telecardiologie impose que lon puisse disposer de bases de donnees encapsulant pour
chaque patient à la fois des ECG, des donnees cliniques et son historique medical recueillis
de facon synchrone. Malheureusement, il nexiste pas encore de telles bases de donnees
contenant un nombre significatif de cas. A linverse, il existe un certain nombre de bases de
donnees collectees sur differentes populations de patients mais comportant soit des ECG,
soit des donnees cliniques. En labsence de bases de donnees synchrones bien documentees,
lalternative est donc :
dexploiter separement les bases de donnees ECG et les bases de donnees cliniques,
de developper separement des modules dinterpretation de lECG et de stratification
des facteurs de risque,
enfin de concevoir des scenarios de collaboration entre ces differents modules.
Cest cette approche que nous allons developper tout au long de ce chapitre en
presentant tout dabord une methode dinterpretation automatique de lECG mettant
en uvre des comites de reseaux de neurones artificiels optimises pour diagnostiquer
les infarctus aigues, puis une methode visant à quantifier limportance du risque cardiovasculaire au moyen dun reseau bayesien. Enfin nous proposons un modèle de diagnostic
cardiologique global combinant les resultats de linterpretation de lECG et de levaluation
des facteurs de risque.
2.2
Interpr
etation automatique de lECG
Il existe de par le monde plusieurs dizaines, voire plusieurs centaines de programmes

dinterpretation automatique de lECG. La plupart sont bases sur une approche heuristique ou melangent approche heuristique et approche statistique. En effet, peu de programmes bases sur une approche statistique pure ou sur des reseaux de neurones ont recu
une acceptabilite suffisante du corps medical qui exige generalement quun programme
dinterpretation automatique de lECG justifie, en termes medicaux comprehensibles par
lensemble des professionnels de sante, les raisons de la decision.
Le contexte dapplication dun tel module dans le cadre du projet EPI-MEDICS est
28
tout autre car ici lon cherche avant tout à privilegier la performance de la detection
dune ischemie ou dun infarctus aigue en minimisant le nombre de faux positifs et de
faux negatifs sachant que par ailleurs lon envoie lECG au cardiologue pour quil puisse
controler sil le juge utile la qualite de linterpretation. Dans ce contexte, lutilisation de
comites de reseaux de neurones artificiels parat extremement pertinente. Les reseaux de
neurones en effet constituent un paradigme informatique de reconnaissance de formes qui
sest avere très prometteur pour resoudre des applications de medecine en general [65] et
plus particulièrement le diagnostic de linfarctus. De nombreuses etudes ont demontre la
qualite de linterpretation automatique de lECG par reseaux de neurones dans le cadre
dun scenario de diagnostic de linfarctus du myocarde. Parmi ces etudes, il convient de
citer plus particulièrement Baxt [66] et Harrison et al. [67] qui ont utilise lhistorique
medical du patient ainsi que des donnees dECG et des donnees cliniques comme entrees
du reseau de neurones. Des etudes plus recentes [68, 69] ont utilise les reseaux de neurones
dans le but de faire un outil daide à la decision dedie aux services durgence. Utilisant
uniquement lECG 12D comme donnees dentree au reseau de neurones, Heden et al. [70]
pouvaient detecter linfarctus avec un taux de reussite egal voire meilleur quà celui dun
cardiologue experimente. Une autre etude [22] a montre linteret dutiliser des paramètres
seriels de lECG pour diagnostiquer linfarctus.
Dans le reste de cette section, nous allons presenter les reseaux de neurones, les
mecanismes dapprentissage ainsi que les techniques doptimisation, en particulier lapproche multi-expert par des comites de reseaux de neurones. Ensuite, nous allons presenter
les methodes statistiques utilisees comme temoin de comparaison avec les reseaux de neurones : lanalyse discriminante. Enfin, nous presentons les evaluations effectuees sur une
base de donnees ECG, la base de donnees de Lund, par rapport à lanalyse discriminante
et deux experts humains : un cardiologue experimente et un medecin interne.
2.2.1
Les r
eseaux de neurones
D
efinition
Les reseaux de neurones artificiels sont des modèles de calcul dont la conception est
très schematiquement inspiree du fonctionnement cerebral et des structures neuronales.
Ils sont generalement optimises par des methodes dapprentissage de type statistique qui
leur permettent de prendre des decisions sappuyant davantage sur la perception que sur
le raisonnement logique formel [71].
Couches, connexions et fonctions dactivation

Un reseau de neurones est ainsi constitue de neurones connectes par des liaisons qui
permettent à chaque neurone denvoyer et recevoir des signaux en provenance des neurones
29
qui le precèdent. Chacune de ces connexions recoit une ponderation qui determine son
impact sur les neurones quelle connecte. Chaque neurone dispose ainsi dune entree,
qui lui permet de recevoir de linformation dautres neurones, mais aussi dune fonction
dactivation, qui est dans les cas les plus simples, une simple fonction identite du resultat
obtenu par lentree, et enfin une sortie (Figure 2.1).
Fig. 2.1 Fonctionnement des neurones : chaque neurone m additionne les valeurs de ses
entrees (n1 , n2 , n3 ) multipliees par des poids (W1 , W2 , W3 ), passe le resultat dans une
fonction dactivation, et le renvoie aux neurones qui le suivent.
Le choix dune fonction dactivation se revèle etre un element constitutif important
des reseaux de neurones. Le plus souvent des fonctions non lineaires seront necessaires.
Les fonctions couramment utilisees comme fonctions dactivation sont (Figure 2.2) :
La fonction logistique :
1
(2.1)
Y = F (X) =
(1 + e(dX) )
La fonction tangente hyperbolique :
Y =
2
1
(1 + e(2X) )
(2.2)
Les fonctions à seuil telles que :

0 si X < 0
Y = 1 si X > 0
(2.3)
Types de r
eseaux
Les reseaux de neurones ont suscite beaucoup dinteret au cours des dernières decennies
et enormement de variantes ont dejà vu le jour : les perceptrons multi-couches [72], les
reseaux de Kohonen [73, 74], les reseaux de Hopfield [75], etc.
Les perceptrons multi-couches Lexemple de reseau de neurones le plus utilise reste

le perceptron multi-couches (Figure 2.3). Dans un perceptron, les neurones sont organises
suivant une couche dentree, une couche de sortie, et une ou plusieurs couches cachees qui
assurent la connexion entre lentree et la sortie du reseau :
(a) La fonction logistique.
30
(b) La fonction tangente hyperbolique.
(c) La fonction à seuil.
Fig. 2.2 Exemples de fonctions dactivation.
La couche dentree recoit les donnees sources que lon veut utiliser pour lanalyse.
Dans le cas de laide au diagnostic medical, cette couche recevra les symptomes. Sa
taille est donc directement determinee par le nombre de variables dentrees.
La couche de sortie donne le resultat obtenu. Dans le cas de laide au diagnostic
medical, cette couche donne le diagnostic sous forme dune probabilite entre 0 (sujet
sain), et 1 (diagnostic confirme). Sa taille est directement determinee par le nombre
de variables (ou diagnostic) quon veut en sortie.
La couche intermediaire est dite cachee dans le sens quelle na quune utilite intrinsèque pour le reseau de neurones et na pas de contact direct avec lexterieur.
Le principe de fonctionnement est le suivant : nous disposons initialement dune base
de connaissances constituee de couples de donnees entrees / sorties (symptomes, signes
cliniques / pathologie) et nous souhaitons utiliser cette base de donnees pour configurer
et entraner le reseau de neurones, grace à un algorithme informatique, à reproduire les
associations constatees entre les entrees et les sorties de la base de connaissances.
Les fonctions dactivation de la couche cachee sont en general non lineaires mais il ny
a pas de règle à respecter. Le choix du nombre de couches cachees et de leur taille nest pas
implicite et doit etre ajuste. En general, plusieurs tests sont necessaires. On commence
par exemple par prendre une moyenne du nombre de neurones des couches dentree et de
sortie, mais ce nest pas toujours le meilleur choix. Il est donc souvent necessaire, pour
obtenir de bons resultats, dessayer le plus de tailles possibles.
31
Fig. 2.3 Illustration dun reseau de neurones de type perceptron multi-couches.

Les
etapes de conception dun r
eseau de neurones
Choix et pr
eparation des
echantillons Le processus delaboration dun reseau de
neurones commence par le choix et la preparation des echantillons de donnees. En general
une partie de lensemble de donnees est simplement ecarte de lechantillon dapprentissage
et conserve pour les tests hors echantillon afin de verifier la capacite de generalisation du
reseau.
Elaboration de la structure du r
eseau La structure du reseau depend etroitement
du type de reseau : un perceptron standard, un reseau de Hopfield, un reseau de Kohonen,
etc. Ensuite en fonction du type choisi, lelaboration de la structure du reseau peut varier :
dans le cas du perceptron, il faudra aussi determiner le nombre de neurones dans la couche
cachee.
Apprentissage Lapprentissage consiste à calculer les ponderations optimales des

differentes liaisons du reseau de neurones, en utilisant un echantillon de donnees (par
exemple une base de donnees ECG, o`
u les paramètres de lECG alimentent lentree du
reseau et le diagnostic medecin de lECG sert comme verite clinique et sera compare par
rapport à la sortie du reseau). Lapprentissage peut se faire de differentes manières :
Le mode supervise : dans ce type dapprentissage, le reseau sadapte par comparaison entre le resultat quil a calcule, en fonction des entrees fournies, et la reponse
attendue en sortie. Ainsi, le reseau va se modifier jusquà ce quil trouve la bonne
sortie, cest-à-dire celle attendue, correspondant à une entree donnee.
Le mode non-supervise : Dans ce cas, lapprentissage travaille sur un ensemble de
donnees sans information prealable sur le nombre de classes et sur la classe des
echantillons. Il est generalement base sur des probabilites. Le reseau va se modifier
en fonction des regularites statistiques de lentree et etablir des categories, en attribuant et en optimisant un critère dappartenance aux categories identifiees par
32
lapprentissage.
Par la suite, dans le cadre de notre application, du fait que nous disposons de la verite sur
la sortie du reseau, nous nous interesserons surtout à lapprentissage supervise que nous
allons detailler ci-après.
Apprentissage par r
etropropagation La methode dapprentissage supervise la plus
utilisee est la retropropagation [76]. Le principe de la retropropagation consiste à alimenter
le reseau de neurones par les donnees de lensemble dapprentissage, et en fonction de
lerreur obtenue en sortie par rapport à la verite (sortie de lensemble), nous corrigeons
les poids accordes aux neurones.
On montre chaque exemple au reseau de neurones, puis on propage ces valeurs
vers la sortie. La prediction que lon obtient en sortie est au debut erronee.
On calcule la valeur de lerreur (cest à dire la difference entre les valeurs desirees
et les valeurs predites), puis on retropropage cette erreur en remontant le reseau
et en modifiant les poids proportionnellement à la contribution de chacun à lerreur
totale.
On repète ce mecanisme pour chaque exemple de donnees et tant que le taux de
reclassement sur les donnees sameliore.
Il faut bien prendre garde cependant de ne pas surentraner un reseau de neurones en lui
faisant apprendre par coeur car il deviendrait alors moins performant. Il existe diverses
techniques qui permettent deviter de tomber dans le phenomène de sur-apprentissage
telles que la validation croisee (cross-validation), et larret precoce (early stopping) :
Larret precoce consiste à diviser lensemble dapprentissage en deux sous-ensembles.
Le premier sous-ensemble sert à entraner le reseau. Le deuxième sous-ensemble, dit
de validation, joue le role darbitre de telle sorte que le cycle dapprentissage est
repete tant que lerreur obtenue en sortie sur les donnees de lensemble de validation
est decroissante.
La validation croisee consiste à diviser lensemble dapprentissage en N (par exemple
5) sous-ensembles egaux et disjoints. Lapprentissage est ensuite effectue sur les
N 1 sous-ensembles et lerreur (ei ) est calculee sur le sous-ensemble restant, servant de validation. La procedure est repetee N fois, en choisissant à chaque fois un
sous-ensemble de validation different. Enfin, un taux derreur moyen (E) est calcule et lapprentissage est refait en utilisant cette fois la totalite de lensemble de
donnees avec comme condition darret lerreur moyenne (E) calculee lors de letape
precedente (tableau 2.1)
Techniques doptimisation
Les reseaux de neurones, dans leur structure meme, permettent de nombreuses
ameliorations : choix du nombre de couches cachees, du nombre de neurones dans les
couches cachees, du type de fonctions dactivation, etc. Mais la technique la plus pertinente semble etre la combinaison de differents classifieurs pour former ce que dans la
33
Tab. 2.1 Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage est ensuite
effectue sur les N 1 sous-ensembles s2 à S5 et lerreur est calculee sur le sous-ensemble
restant s1, servant de validation. Cette operation est reiteree quatre fois en choisissant
chaque fois un ensemble de validation different. Enfin, un taux derreur moyen est calcule
et lapprentissage est refait en utilisant la totalite de lensemble de donnees.
S
erie dapprentissage
s2 s3 s4 s5
s1 s3 s4 s5
s1 s2 s4 s5
s1 s2 s3 s5
s1 s2 s3 s4
Validation
s1
s2
s3
s4
s5
litterature on qualifie de comites ou ensembles de reseaux de neurones. Lobjectif est

dameliorer la capacite de generalisation en combinant plusieurs reseaux individuels entranes à effectuer la meme tache, ce qui produit une performance largement superieure
à celle obtenue par chaque reseau individuel. Linteret et lefficacite de lapproche ensembliste pour ameliorer la performance des reseaux de neurones ont dejà ete justifies à la
fois theoriquement [77, 78] et empiriquement [79].
La creation dun comite de reseaux de neurones est souvent divisee en deux etapes [80].
La première est la creation des reseaux individuels composants le comite et la seconde est
la combinaison appropriee de ces reseaux pour produire la sortie du comite. La facon et
limpact de combiner les sorties individuelles ont ete etudie dans [78]. Dans cet article,
on a montre que lerreur quadratique realisee par le comite, lorsquil sagit de realiser
une prediction unique, est egale à lerreur quadratique moyenne des reseaux individuels
diminuee de la diversite, definie comme etant la variance des sorties des reseaux individuels. Cest la raison pour laquelle, pour reduire lerreur sur le comite, il faut augmenter
la diversite, sans trop augmenter les erreurs des reseaux individuels.
La methode la plus simple pour creer des comites de reseaux de neurones est dentraner, sur un meme ensemble dapprentissage, une selection de reseaux individuels choisis
avec un parametrage aleatoire initial des poids. Comme linitialisation des poids est faite
aleatoirement au debut, les reseaux evoluent differemment dans la phase dapprentissage et
donnent donc des resultats sensiblement differents. Une approche plus elaboree consiste
à entraner chacun des reseaux du comite sur un sous-ensemble different de lensemble
dapprentissage initial. Les variantes de cette approche sont diverses. Dans la technique
du Bagging [81], chaque sous-ensemble dapprentissage est tire uniformement, avec remise, de lensemble initial. La prediction finale est basee sur la sortie des divers reseaux du
comite : moyenne des sorties, vote majoritaire des classifieurs, etc. Le Boosting [82] utilise
aussi le tirage avec remise, mais les echantillons sont construits de facon à favoriser le tirage
des exemples consideres comme difficiles à classer par le reseau precedent. La prediction fi-
34
nale est une combinaison (vote pondere) des diverses predictions. Une troisième approche
consiste à realiser une selection ciblee (à la place dune simple selection aleatoire) du
parametrage initial des poids des reseaux [83, 84, 85]
Enfin, les performances des reseaux de neurones peuvent etre ameliorees an appliquant
un pre-traitement des donnees, tels que lanalyse en composantes principales (ACP).
LACP sur les donnees en entree du reseau permet en effet de ne garder que les caracteristiques importantes des donnees de depart et se concretise en general par un apprentissage plus efficace du reseau de neurones [22, 86].
2.2.2
Conception, r
ealisation et
evaluation du module dinterpr
etation de lECG par r
eseaux de neurones
Developper une nouvelle methode de reconnaissance de formes et en particulier un

nouveau module dinterpretation automatique de lECG necessite de pouvoir disposer
dun ensemble dapprentissage et de test consequent et de sassurer de la qualite et de
la robustesse des algorithmes developpes en effectuant des evaluations rigoureuses par
comparaison par rapport aux experts humains.
Grace aux cooperations instaurees par le projet EPI-MEDICS, nous avons eu la chance
de pouvoir acceder à une base de donnees ECG serielles constituee par lequipe du Professeur Edenbrandt de lUniversite de Lund en Suède, dont la caracteristique majeure
est davoir ete collectee dans differents services durgence cardiologique des Hopitaux de
Lund dans le but de constituer une base de donnees de reference pour la mise au point
de systèmes daide à la decision pour la detection de linfarctus aigue. Bien que les ECG
aient ete collectes à un stade devolution de lischemie qui est bien posterieur à celui
survenant en ambulatoire ou au domicile des patients, nous pensons neanmoins que la
base de donnees de Lund est une base de donnees majeure, non pas pour optimiser les
processus de decision qui seront utilises dans le PEM et qui de toutes facons devront
etre specifiques aux patients, mais au moins pour valider les concepts et larchitecture des
reseaux de neurones qui nous allons presenter dans la suite de ce chapitre, juste après une
brève description de la base de donnees de Lund.
Ensembles dapprentissage et de test

La base de donnees de Lund est composee dECG enregistres sur des patients qui se
sont presentes au service des urgences de lHopital Universitaire de Lund (Suède) entre
janvier 1990 et Juin 1997 [22]. Chaque ECG a ete classe dans lune des deux categories
suivantes :
1. AMI (Acute Myocardial Infarction), si lECG enregistre provenait dun patient pour
lequel le diagnostic dinfarctus a ete confirme lors de sa sortie de lunite des soins
35
coronariens avec un diagnostic dinfarctus.

2. Controle, si lECG enregistre provenait dun patient pour lequel le diagnostic
confirme etait un diagnostic autre que AMI.
Pour chaque ECG enregistre, un ECG precedent du meme patient a ete selectionne
dans la base de donnees de lhopital. Les ECG de la categorie AMI et leurs predecesseurs
ont ete regroupes dans le groupe AMI et les paires correspondant à la categorie controle
ont ete assignees au groupe de controle.
Le diagnostic dAMI a ete etabli si au moins 2 des 3 critères suivants ont ete confirmes :
une douleur thoracique caracteristique durant au moins 20 min, un niveau eleve de creatine
kinase (CK), ou des changements electocardiographiques seriels caracteristiques. Des valeurs de creatine kinase-MB > 0.23 mkat/L ainsi quune augmentation et une diminution
typiques ont ete utilises pour diagnostiquer lAMI. Les marqueurs electrocardiographique
de lAMI sont : une apparition dune onde Q dans au moins 2 derivations contigues et/ou
une inversion de londe T presente dans au moins 2 derivations contigues après un susdecalage du segment ST dans ces derivations. Enfin, un cardiologue experimente a valide
chaque diagnostic.
Les ECG ont ete recueillis par un electrocardiographe 12 derivations et echantillonnes
à une frequence de 1000 Herz. Pour chaque ECG, on dispose dun complexe median PQRS-T dune duree de 1 sec representatif de lenregistrement de 10 sec dorigine. La
population detude consiste en un total de 4691 paires dECG. Le groupe final dAMI est
compose de 902 paires dECG (546 hommes et 356 femmes, age : m = 74 11 ans)
et le groupe final de controle de 3789 paires dECG (1954 hommes et 1835 femmes, age :
m = 70 15 ans).
Interpr
etation des ECG par des experts humains
Chaque ECG durgence de la base de donnees de Lund a ete interprete de manière
independante par un cardiologue experimente et par un medecin interne, dabord en ne
tenant compte que du seul ECG enregistre dans le service durgence, puis en tenant
compte de lECG de reference. Les ECG ont ete classes dans les categories suivantes :
1. D1 : Infarctus confirme.
2. D2 : Infarctus probable.
3. D3 : Infarctus peu probable.
4. D4 : pas dinfarctus.
Ces diagnostics ont ete etablis en nayant aucune autre information à leur disposition que
les ECG et les dates dacquisition des deux ECG (analyse serielle).
36
M
ethodes
En situation durgence et egalement dans le cadre de lutilisation du PEM, deux situations peuvent se produire. Soit lon dispose dun ECG de reference : dans ce cas il vaut
mieux realiser une analyse serielle. Soit lon ne dispose pas dun ECG de reference car inexistant ou lon narrive pas à le retrouver faute dun système dinformation performant :
dans ce cas il faudra se contenter dun programme danalyse unaire. Cest exactement
cette demarche que nous avons suivie en developpant deux versions du programme dinterpretation automatique des ECG toutes les deux basees sur des comites de reseaux de
neurones de type perceptron multicouches (PMC), lun de type unaire que nous tenterons
sur les enregistrements effectues en urgence, lautre de type serielle prenant en compte les
paramètres de lECG reference pour etablir le diagnostic des ECG enregistres en urgence.
La première etape a ete de constituer deux ensembles dapprentissage et de test
independants. Lensemble de test a ete forme en tirant 988 cas au hasard sur la totalite de la base de donnees de Lund (199 cas dAMI et 789 cas de controle). Lensemble
dapprentissage est compose du reste des 3703 cas (soit 703 cas dAMI et 3000 cas de
controle).
La deuxième etape vise à reduire la quantite de donnees. En effet, un programme
danalyse automatique des ECG calcule en moyenne 500 à 1000 descripteurs. Dans notre
cas nous disposons pour chaque enregistrement : ECG de reference et ECG durgence, de
(1112)= 132 paramètres choisis pour leur pertinence eu egard à la detection des AMI
[8]. Ils correspondant à 11 mesures caracteristiques des ondes QRS et T sur chacune des
12 derivations : duree de QRS ; aire de QRS ; amplitudes de Q, R, et S ; et 6 mesures de
ST-T : (amplitude de ST-J, pente de ST, amplitude de ST 2/8, amplitude de ST 3/8,
amplitude de T positive et amplitude de T negative).
Pour lensemble des ECG durgence, nous effectuons une analyse en composantes principales (ACP), afin de reduire le nombre de variables. A lissue de lACP, 16 variables sont
conservees : elles correspondent à la duree de QRS, laire de QRS, les amplitudes des ondes
Q, R et S, les amplitudes de ST et la duree de londe T. Ces 16 variables constitueront
notre premier jeu de donnees et seront utilisees pour lanalyse unaire.
Pour permettre lanalyse serielle, une nouvelle analyse en composantes principales est
effectuee sur la difference entre les 132 paramètres des ECG courants et ceux des ECG de
reference. 16 nouveaux paramètres correspondant à levolution de la duree de QRS, laire
de QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la duree de londe
T entre ECG courants et ECG de reference, sont extraits, et, ajoutes aux 16 paramètres
decrits ci-dessus, les 32 paramètres formeront le deuxième jeu de donnees.
Ces deux jeux de donnees sont ensuite utilises pour configurer deux comites de reseaux
de neurones : le premier pour les paramètres unaires et le deuxième pour les paramètres
seriels. Les performances obtenues par les deux comites de reseaux de neurones sont enfin
compares par rapport aux resultats dune analyse discriminante effectuee en utilisant les
37
memes ensembles dapprentissage et de test que pour les reseaux de neurones et ceux
obtenus par linterpretation realisee par deux experts : un cardiologue experimente et
un medecin interne. Enfin, pour realiser notre modèle de reseaux de neurones, ainsi que
tous les tests devaluation, nous avons utilise MatlabTM et sa bote à outils reseaux de
neurones. Lanalyse discriminante a ete realisee avec le logiciel XLSTATTM .
R
ealisation du mod`
ele de r
eseaux de neurones Plusieurs paramètres sont à
determiner au niveau de larchitecture des reseaux : nombre de neurones sur la couche
cachee, fonctions dactivation pour le passage dune couche à lautre, algorithme utilise
en apprentissage, etc.
Choix de lalgorithme dapprentissage Pour les perceptrons multicouches

(PMC), Matlab dispose de la version basique de lalgorithme de retropropagation,
mais egalement dune variete dalgorithmes dapprentissage bases sur le principe de
retropropagation qui varient en co
ut de calcul et vitesse de convergence : les algorithmes
de la famille quasi-Newton, ceux bases sur la descente du gradient conjugue, etc. Certains
de ces algorithmes sont adaptes à des taches de classement alors que dautres sont plus
performants dans lapproximation de fonctions.
Parmi ces algorithmes, la methode de Levenberg-Marquardt [87, 88] est devenue un
standard pour loptimisation de lerreur quadratique à cause de ses proprietes de convergence rapide et de robustesse. De meme, Levenberg-Marquardt est un algorithme très
puissant doptimisation non-lineaire ce qui la fait adopter pour de nombreuses taches de
classement dans divers domaines [89, 90, 91, 92].
Pour notre application, nous avons donc decide dutiliser lalgorithme de LevenbergMarquardt. Enfin, pour eviter le sur-apprentissage, nous avons utilise la methode darret
precoce (early stopping), dejà decrite dans la section 2.2.1.
Choix des fonctions dactivation Le choix de la retro-propagation pour lapprentissage du reseau impose des fonctions derivables. Les fonctions sigmodes comme
la fonction tangente-sigmode, la fonction logarithme-sigmode ou la fonction gaussienne
sont les fonctions usuellement utilisees pour les neurones des couches cachees. Dans notre
situation, nous souhaitons avoir en sortie du reseau des valeurs comprises entre 0 et 1,
o`
u un 1 correspond à la categorie AMI et 0 signifie que le cas appartient à lensemble
de controle. Nous avons donc choisi dutiliser des fonctions logarithme-sigmode à la fois
pour la couche cachee et celle de sortie.
Choix de larchitecture neuronale Il sagit de fixer le nombre de couches cachees

ainsi que le nombre de neurones dans chaque couche. Le choix dune seule couche cachee
nous a semble etre un bon compromis entre la complexite (et donc le temps de calcul)
38
et la performance du reseau. Reste encore le problème du nombre de neurones qui la

composent. Il ny a pas de règles ou de lois en la matière, et ce nombre se determine
souvent empiriquement. Cest un travail long et fastidieux qui necessite de nombreuses
experimentations. Notre objectif etant dans un premier temps devaluer la robustesse des
reseaux de neurones, nous avons utilise la configuration utilisee dans [22], à savoir 10
neurones sur la couche cachee pour lanalyse unaire (jeu de donnees de 16 variables) et 15
neurones pour lanalyse serielle (jeu de donnees de 32 variables). Le nombre de neurones
en entree sera egal au nombre de paramètres du jeu de donnees, et la couche de sortie sera
composee dun seul neurone, indiquant si le patient fait partie de la classe des AMI ou de
la classe de controle. Enfin, notre methode se diffère sur plusieurs points de la methode
adoptee par Ohlson et al [22] :
Un paramètrage de reseaux de neurones differents (au niveau de la fonction dactivation des neurones de la couche cachee).
Une difference au niveau de lapprentissage (version basique vs. la variante
Levenberg-Marquardt de lalgorithme de retropropagation).
Une politique differente pour eviter le surapprentissage (arret precoce vs. validation
croisee).
La figure 2.4 illustre le fonctionnement du comite de reseaux de neurones
unaires/seriels. Ce comite recoit les 16/32 paramètres unaires/seriels et etablit un score
de risque compris entre 0 et 1. Dans le cadre dEPI-MEDICS 4 niveaux de risque ont ete
defini :
pas de risque : si le score de risque est compris entre 0 et 0.125.
risque mineur : si le score de risque est compris entre 0.125 et 0.25.
risque moyen : si le score de risque est compris entre 0.25 et 0.45.
risque majeur : si le score de risque est superieur à 0.45.
39
Fig. 2.4 Illustration du fonctionnement du comite de reseaux de neurones unaires/seriels

utilise pour linterpretation de lECG.
40
Tests d
evaluation - Courbes ROC
Quatre situations sont habituellement issues de levaluation dune methode de reconnaissance de formes (comites de reseaux de neurones ou analyse discriminante) dichotomique (2 classes) sur un echantillon de test. En effet, le resultat de laffectation
peut etre positif ou negatif, et la pathologie est presente (vrai) ou absente (faux). Deux
interpretations des resultats du classifieur sont correctes (vrai positif et vrai negatif).
Deux sont fausses (faux positif et faux negatif). Ces quatre situations peuvent donc etre
representees sous la forme dune matrice de confusion 2 2.
Tab. 2.2 Matrice de confusion.
R
esultats de la machine
Classement
positif
Classement
negatif
V
erit
e
Maladie presente Maladie absente
vrai positif
faux positif
a
b
faux negatif
vrai negatif
c
d
Les paramètres issus de la matrice de confusion permettent de calculer quatre ratios

indicateurs de la qualite de la methode de classement :
sensibilite : pourcentage davoir une interpretation positive quand la pathologie est
presente : a / (a + c)
specificite : pourcentage davoir une interpretation negative quand il ny a pas de
pathologie : d / (b + d) ;
valeur predictive positive : pourcentage davoir un cas presentant la pathologie quand
linterpretation est positive : a / (a + b) ;
valeur predictive negative : pourcentage davoir un cas ne presentant pas la pathologie quand linterpretation est negative : d / (c + d).
La performance en % de bien classes de la methode de classement est definie par la
ratio suivant : (a+d)/(a+b+c+d).
Les matrices de confusion sont obtenues en fixant un seuil de risque au delà duquel le
diagnostic etabli par la methode de classement pour le cas en question est juge comme
pathologique. Pour chaque seuil, une matrice de confusion, et donc les specificites et
sensibilites associees, sont calculees.
Pour chacune des deux methodes de classement (reseaux de neurones et analyse discriminante), nous utilisons les specificites et sensibilites associees à chaque seuil pour
ensuite tracer la courbe ROC (Receiver Operator Characteristic curve) associee. Cette
dernière represente la sensibilite en fonction de (1-specificite). Elle permet de regler la
capacite diagnostique des tests, en permettant au chercheur deffectuer le compromis souhaite entre specificite et sensibilite. Laire sous la courbe ROC sert comme indicateur de
41
la performance generale de la methode à evaluer : plus cette aire est elevee, meilleure est
la methode (Figure 2.5).
Fig. 2.5 Comparaison du pouvoir discriminant de deux methodes de classement. Selon

ces deux traces de courbes ROC, la methode A est meilleure que la methode B.
R
esultats
Evaluation de linterpr
etation des experts humains Les experts humains, cardiologue et medecin interne, ont classe les 988 ECG durgence de lensemble de test en 4
categories (D1 : infarctus confirme, D2 : probable, D3 : peu probable, D4 : pas dinfarctus) en tenant compte dans un premier temps uniquement de lECG durgence (analyse
unaire), puis en tenant compte de lECG de reference (analyse serielle).
En analyse unaire, le cardiologue a classe 86 ECG dans la categorie D1 (infarctus
confirme), 371 ECG en D2 (infarctus probable), 391 ECG en D3 (infarctus peu probable)
et 140 ECG en D4 (pas dinfarctus). Le medecin interne a classe à son tour 32 ECG en
D1, 171 ECG en D2, 688 ECG en D3 et 97 ECG en D4.
En analyse serielle, le cardiologue a classe 80 ECG dans la categorie D1 (infarctus
confirme), 282 ECG en D2 (infarctus probable), 483 ECG en D3 (infarctus peu probable)
et 143 ECG en D4 (pas dinfarctus). Le medecin interne a classe à son tour 41 ECG en
D1, 174 ECG en D2, 455 ECG en D3 et 318 ECG en D4.
Le tableau 2.3 illustre les resultats de lanalyse unaire des deux experts par rapport
à la verite clinique. De la meme facon, le tableau 2.4 illustre les resultats de lanalyse
serielle des deux experts.
` partir des ces resultats, nous avons calcule 3 paires de sensibilite/specificite D1
A
(infarctus confirme) contre D2+D3+D4(infarctus probable, peu probable ou pas dinfarctus considere comme controle) ; D1+D2 (infarctus confirme ou probable considere
42
comme infarctus) contre D3+D4 (infarctus peu probable ou pas dinfarctus considere
comme controle) ; D1+D2+D3 (Infarctus confirme, probable ou peu probable considere
comme infarctus) contre D4 (pas dinfarctus considere comme controle) par analyse
(unaire/serielle), et nous avons utilise pour construire deux courbes ROC par expert
(cardiologue/interne, figures 2.8(c) et 2.8(d)).
Pour lanalyse unaire, le cardiologue realise une sensibilite de 34% et une specificite
de 97% pour D1 contre D2+D3+D4 ; 83% et 63% pour D1+D2 contre D3+D4 ; 97% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 13% et une
specificite de 99% pour D1 contre D2+D3+D4 ; 50% et 86% pour D1+D2 contre D3+D4 ;
97% et 11% pour D1+D2+D3 contre D4.
Pour lanalyse serielle, le cardiologue realise une sensibilite de 34% et une specificite
de 98% pour D1 contre D2+D3+D4 ; 78% et 73% pour D1+D2 contre D3+D4 ; 96% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 15% et une
specificite de 98% pour D1 contre D2+D3+D4 ; 56% et 87% pour D1+D2 contre D3+D4 ;
92% et 38% pour D1+D2+D3 contre D4.
Tab. 2.3 Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG durgence de lensemble de test, effectuee par les deux experts, en fonction de la verite clinique
(199 cas dinfarctus (AMI) et 789 cas de controle). Ce tableau illustre les resultats de linterpretation unaire effectuee sur les ECG durgence sans avoir eu connaissance des ECG
de reference des patients.
Cardiologue
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)
D2+D3+D4
772
130
97
D1
17
69
34
-
D3+D4
498
33
63
D1+D2
291
166
83
-
D4
135
5
17
D1+D2+D3
654
194
97
-
M
edecin interne
Controles : n = 789
Sensibilite (%)
Specificite (%)
D2+D3+D4
783
173
99
D1
6
26
13
-
D3+D4
686
99
86
D1+D2
103
100
50
-
D4
93
4
11
D1+D2+D3
696
195
97
-
Evaluation de linterpr
etation des r
eseaux de neurones et de lanalyse discriminante Dans un deuxième temps, pour chacun des deux jeux de donnees :
1. 16 paramètres issus de lACP sur les ECG durgence de la base de donnees de Lund,
utilises pour faire de lanalyse unaire.
43
Tab. 2.4 Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse serielle)
Cardiologue
Controles : n = 789
Sensibilite (%)
Specificite (%)
D2+D3+D4
778
130
98
D1
11
69
34
-
D3+D4
583
43
73
D1+D2
206
156
78
-
D4
136
7
17
D1+D2+D3
653
192
96
-
M
edecin interne
Controles : n = 789
Sensibilite (%)
Specificite (%)
D2+D3+D4
779
168
98
D1
10
31
15
-
D3+D4
687
86
87
D1+D2
102
113
56
-
D4
304
14
38
D1+D2+D3
485
185
92
-
2. 32 paramètres issus de lACP sur les ECG durgence et de reference de la base de

donnees de Lund, utilises pour faire de lanalyse serielle.
jai effectue lapprentissage de deux comites de reseaux de neurones et de deux modèles
danalyse discriminante avec lensemble dapprentissage de 3703 patients. Larchitecture
des deux comites de reseaux de neurones peut etre definie comme suit :
Pour lanalyse unaire : un comite de 50 reseaux de neurones, avec une architecture
individuelle dune couche cachee de 10 neurones.
Pour lanalyse serielle : un comite de 50 reseaux de neurones, avec une architecture
individuelle dune couche cachee de 15 neurones.
Ensuite, jai evalue la performance des comites de reseaux de neurones et de lanalyse
discriminante sur les 988 paires dECG de lensemble de test. La sortie globale de chacun
des deux comites est la moyenne des sorties individuelles des 50 reseaux sur lensemble
de test.
Les aires sous les courbes ROC correspondant aux ensembles dapprentissage unaire
et seriel des reseaux de neurones sont respectivement de 0.92 et 0.98.
Les figures 2.6 et 2.7 illustrent les courbes ROC des 50 reseaux et de la sortie globale
des comites sur lensemble de test en analyse unaire et serielle.
Les deux figures montrent clairement une amelioration sensible des performances du
comite (aire sous la courbe ROC de 0.861) par rapport à chacun des reseaux individuels
(meilleur reseau : aire sous la courbe ROC de 0.837), confirmant ainsi les resultats de la
litterature evoques plus haut dans la section 2.2.1. Cette augmentation des performances
est encore plus nette dans le cas de lanalyse serielle (comite : aire de 0.876, meilleur
reseau : aire de 0.838). Ce qui peut etre interprete comme une application du theorème
44
central limite.
1
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
Sortie individuelle de chacun des 50 rseaux

Sortie globale du comit, aire = 0.861
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 2.6 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse unaire.
Enfin, les figures 2.8(a) à 2.8(d) montrent les courbes ROC de lensemble des methodes
de diagnostic testees dans cette section : comites de reseaux de neurones, analyse discriminante, cardiologue et medecin interne, en analyse unaire et serielle.
En analyse unaire, les aires sous les courbes ROC sont respectivement de 0.861 pour
le comite de 50 reseaux de neurones, 0.753 pour lanalyse discriminante, 0.793 pour le
cardiologue et 0.713 pour le medecin interne.
En analyse serielle les performances sont sensiblement meilleures. Le comite de reseaux
de neurones affiche une aire sous la courbe ROC de 0.876, lanalyse discriminante une aire
de 0.787, le cardiologue une aire de 0.806 et le medecin interne une aire de 0.778.
Ces resultats montrent la superiorite des reseaux de neurones par rapport à lanalyse
discriminante et linterpretation des experts humains en analyse unaire et serielle. De
meme, ils demontrent linteret de lanalyse serielle.
45
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
Sortie individuelle de chacun des 50 rseaux

Sortie globale du comit, aire = 0.876
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 2.7 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse serielle.
2.2.3
Discussion
Il apparat clairement que les reseaux de neurones utilises en comite donnent de

meilleurs resultats que les methodes statistiques (plus particulièrement ici lanalyse discriminante). En effet, si lanalyse discriminante donne des resultats equivalents à ceux
dun reseau de neurones pris individuellement, la superiorite des reseaux de neurones provient de la combinaison de leurs resultats. On peut assimiler cette methode à un système
multi-experts. Le theorème central limite montre donc son interet dans de telles situations.
La base de donnees de Lund sur laquelle nous avons travaille nechappe pas aux
problèmes inherents aux bases de donnees medicales : en effet, on peut penser quelle ne
contient pas que des cas dinfarctus aigus et des cas parfaitement sains. Au contraire,
dautres maladies sont sans doute presentes dans les ECG, mais elles ne sont pas
referencees : elles peuvent donc fausser le diagnostic du classifieur. De plus, les diagnostics dinfarctus enregistres dans la base de donnees ont ete realises après confirmation
ulterieure de linfarctus et à partir de donnees medicales autres que lenregistrement. Le
diagnostic aurait pu etre different sil avait ete effectue seulement à partir des ECG.
Enfin, et cest bien connu, il ny a pas de verite en medecine : des cas classes dans la
categorie de controle pourraient en realite très bien faire partie de la categorie des AMI et
reciproquement. Les performances de nos classifieurs nen deviennent que plus relatives.
En effet, lECG enregistre à ladmission ne represente quun instantane (en fait 10 sec)
(c) Cardiologue
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.1
0.1
0.3
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
0.2
0.3
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
ECG courant, aire = 0.713

ECG de rfrence + ECG courant, aire = 0.778
0.2
ECG courant, aire = 0.793

ECG de rfrence + ECG courant, aire = 0.806
(a) Comites de reseaux de neurones
Sensibilit
Sensibilit
0.9
Sensibilit
Sensibilit
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0.1
0.1
0.2
0.2
0.3
0.3
0.5
0.6
0.5
0.6
1Spcificit
0.4
0.7
0.8
0.9
0.7
0.8
0.9
Paramtres unaires, aire = 0.753

Paramtres sriels, aire = 0.787
1Spcificit
0.4
Paramtres unaires, aire = 0.861

Paramtres sriels, aire = 0.876

46
(b) Analyse discriminante
(d) Medecin interne
Fig. 2.8 Comparaison des courbes ROC des differentes methodes en analyse unaire et
serielle.
47
de la vie du patient. Une ischemie presente à cet instant peut très bien se resorber toute
seule et ne pas provoquer une montee enzymatique ou au contraire, lECG à ladmission peut etre tout à fait normal et un infarctus aigu peut se developper une demi heure
après. En fait, il faudrait enregistrer lECG en continu et le correler minute par minute ou
meme seconde par seconde avec des explorations quantitatives de letat du myocarde telles
que mesure continue des enzymes, imagerie continue par IRM. . . impossible à realiser en
routine clinique.
Neanmoins, les resultats obtenus dans cette base de donnees de taille relativement importante montrent bien limportance de la variabilite inter-observateurs de linterpretation
humaine, meme en disposant dun trace de reference, et de laide au diagnostic qui doit
etre apportee, meme à un cardiologue confirme. Comme relate recemment par Bates et
al [93], notre etude renforce de facon significative linteret dutiliser les technologies de
linformation pour ameliorer la precision diagnostique. A titre dillustration, pour une
specificite de 90%, la meilleure sensibilite de linterpretation humaine est de 52% alors
que la sensibilite de notre comite de reseaux de neurones atteint 67%, do`
u un gain de
15%.
Les perspectives doptimisation et damelioration de notre methode de classement par
reseaux de neurones sont nombreuses :
Une première piste damelioration est liee aux reseaux de neurones : optimisation
de larchitecture, du parametrage initial precedant lapprentissage, de lalgorithme
dapprentissage, de la combinaison des sorties individuelles des reseaux composants
le comite, etc.
Architecture du reseau. Il faut savoir que notre objectif etait devaluer la robustesse des reseaux de neurones. Nous avons pour cela utilise une configuration
determinee dans [22]. Cependant, un travail doptimisation doit etre fait pour
determiner larchitecture la plus adaptee à ce type de problèmes, cest à dire
linterpretation automatique des ECG. Dans la litterature, de nombreux travaux de recherche ont permis de developper des methodes de reconstruction
automatique de larchitecture des reseaux de neurones moyennant des algorithmes genetiques [94].
Parametrage initial pre-apprentissage. Dans notre application, nous avons
choisi pour chaque reseau individuel un parametrage initial aleatoire des poids.
Si cette approche reste la plus simple et la plus souvent utilisee dans la
litterature, de nouvelles strategies privilegiant une selection ciblee du parametrage initial des reseaux ont commence à prouver leur efficacite à ameliorer
la performance des reseaux de neurones [95, 96].
Une deuxième piste damelioration est liee à lutilisation dinformations
supplementaires, en plus de lECG, tels que les donnees cliniques, lhistorique
medical, etc. de manière à etablir un diagnostic plus personnalise et plus adapte.
Cette approche est decrite dans la deuxième partie de ce chapitre.
48
Conclusion
Actuellement, de nombreux travaux de recherche tentent de developper de nouvelles
approches daide à la decision, dans le but de realiser des systèmes intelligents qui tiennent
compte de la specificite de lutilisateur.
Le cas concret sur lequel nous avons travaille relevait du domaine de lelectrocardiologie
quantitative et de linterpretation automatique des ECG. Nous avons tout dabord propose un modèle original de traitement des donnees, puis nous nous sommes plus particulièrement interesses à la detection des ischemies. Les resultats obtenus montrent linteret
de lutilisation de comites de reseaux de neurones par rapport à des methodes statistiques
(plus particulièrement lanalyse discriminante). Le theorème central limite a montre sa
puissance : il permet daugmenter considerablement les performances des reseaux de neurones pris individuellement.
Quoiquil en soit, il nexiste certainement pas de methode universelle pour laide à la
decision, mais il va falloir au contraire proceder par fusion de classifieurs et par fusion
de donnees en integrant davantage dinformation (donnees cliniques, historique medical,
etc.) dans le processus decisionnel.
2.3
Quantification du risque cardiovasculaire par approche probabiliste
Le système de decision embarque dans le PEM pour la detection des ischemies est
dans sa version actuelle base sur lutilisation de comites de reseaux de neurones artificiels
avec une generation dalarmes et de leur niveau prenant en consideration les scores de
risque evalues par les reseaux de neurones.
Cependant, pour obtenir un diagnostic plus precis et plus personnalise, nous avons
envisage une deuxième approche qui consiste à inclure dans le processus decisionnel une
stratification des informations cliniques du patient telles que les facteurs de risque. Le
fait dajouter une information supplementaire dans la decision finale devrait permettre
davoir une marge de securite supplementaire.
` titre dexemple, si pour un sujet sain de 45 ans sans antecedents cardiaques, le
A
module dinterpretation neuronal etablit un score diagnostic qui correspond à une alarme
dimportance majeure, il est probable que lacquisition de lECG PEM ne se soit pas
deroulee correctement (position pendant lenregistrement, electrodes mal placees. . . ). Par
contre, si dans la famille il y a eu des antecedents dinfarctus avant 50 ans, il se pourrait
que lon soit en presence dune ischemie et il faudrait demander lavis dun cardiologue et
donc suggerer à lutilisateur de transmettre lECG à son medecin traitant ou à un centre
49
de competences. Do`
u linteret de tenir compte des facteurs de risque de la personne
utilisatrice du PEM pour revoir à la hausse ou à la baisse le score de risque et lalarme
associee.
La figure 2.9 illustre levolution du processus decisionnel que nous preconisons de
mettre en place dans le PEM. La version actuellement embarquee dans le PEM consiste en
un module neuronal qui analyse lECG et en fonction du score de risque declenche lalarme
majeure, moyenne, mineure voire aucune alarme. La nouvelle version devrait inclure en
plus du module neuronal, un module de stratification des facteurs de risque que nous
allons decrire dans le reste de cette section. Ce module intervient après linterpretation
de lECG PEM, lorsque lECG est juge comme suspect (ce qui correspond à une alarme
moyenne ou mineure) soit pour confirmer le niveau dalarme, soit le modifier en fonction
des facteurs de risque du sujet.
Fig. 2.9 Schema synoptique du processus decisonnel embarque dans le PEM : a) sa version actuelle ; b) une future version que nous proposons avec lintroduction dun deuxième
score de risque base sur le dossier medical du patient.
2.3.1
50
Choix m
ethodologiques
Pour fusionner des donnees quantitatives (taux de cholesterol, paramètres ECG. . . ) et

qualitatives (historique medical du patient) dans un seul et unique procede de decision,
differentes approches existent.
Approche heuristique
La première approche, qui a ete abordee dans le cadre dEPI-MEDICS, a consiste à
concevoir un système à base de règles, sous forme dalgorithmes (Figure 2.10). Ces règles
ont ete elaborees à partir de directives et recommandations de comites dexperts de sante
publique en general et de cardiologie en particulier.
Fig. 2.10 Illustration dalgorithmes de stratification du risque cardiovasculaire

developpes dans le cadre dEPI-MEDICS.
` titre dexemple lalgorithme A2 calcule pour les sujets sains la probabilite dune
A
atherosclerose coronarienne en se basant sur la douleur thoracique en tant quinformation
de base. Il sagit du modèle probabiliste etabli par Diamond et al [97]. Ce modèle est base
sur trois types de douleur (douleur non-angineuse, douleur typique dangine de poitrine
ou douleur dangine de poitrine atypique), sur quatre classes dage (30-39, 40-49, 50-59,
60-69) et sur le sexe. Pour chaque variable, un score est donne (tableau 2.5) et le risque
dune maladie coronaire est donne en fonction du total des points.
En fait ces algorithmes nont pas vraiment ete implementes dans le PEM car meme si
lon sait calculer, à partir de ces règles, des facteurs (score/index) de risque, aucun expert
na ete capable dindiquer concrètement comment combiner ces scores avec linterpretation
des ECG pour moduler le degre dalarme.
51
Tab. 2.5 Scores de risque en pourcentage de la survenue dune maladie coronaire en

fonction de lage, du sexe et des caracteristiques de la douleur de thoracique. Daprès
Diamond et Forrester, N Engl J Med 1979.
douleur non-angineuse
Age
H
F
30-39 5.2
0.8
40-49 14.1
2.8
50-59 21.5
8.4
60-69 28.1
18.6
douleur atypique dangine

Age
H
F
30-39 21.8
4.2
40-49 46.1
13.3
50-59 58.9
32.4
60-69 67.1
54.4
douleur typique
Age
H
30-39 69.7
40-49 87.3
50-59 92.0
60-69 94.3
dangine
F
25.8
55.2
79.4
90.6
Approche probabiliste
Lautre approche consiste à utiliser des methodes dintelligence artificielle pour
developper des modèles de quantification du risque cardiovasculaire à partir des connaissances medicales et des bases de donnees cliniques. Notre objectif est dutiliser la methode
qui pallie au mieux les problèmes specifiques poses par notre application : prendre des
decisions basees sur des donnees incomplètes et de natures differentes et expliquer le raisonnement en fonction des resultats. Cest pour ces raisons que nous avons choisi une
approche probabiliste basee sur lutilisation des reseaux bayesiens pour realiser notre module de facteurs de risque.
En effet, selon le type dapplication, lutilisation des reseaux bayesiens peut etre envisagee au meme titre que celle dautres modèles : reseaux de neurones, systèmes experts,
arbres de decision, etc. Les aspects suivants des reseaux bayesiens les rendent, dans de
nombreux cas, preferables aux autres modèles :
Acquisition des connaissances : Les reseaux bayesiens donnent la possibilite de rassembler et de fusionner des connaissances de diverses natures dans un meme modèle.
Representation des connaissances : La representation graphique dun reseau bayesien
est explicite, intuitive et comprehensible par un nonspecialiste, ce qui facilite à la
fois la validation du modèle, ses evolutions eventuelles et surtout son utilisation.
Typiquement, un decideur est beaucoup plus enclin à sappuyer sur un modèle dont
il comprend le fonctionnement quà faire confiance à une modèle Bote noire.
Utilisation des connaissances : Un reseau bayesien est polyvalent, i.e. on peut se servir du meme modèle pour evaluer, prevoir, diagnostiquer, ou optimiser des decisions,
ce qui contribue à rentabiliser leffort de construction du reseau bayesien.
Enfin, linteret de lapproche des reseaux bayesiens [55] par rapport à dautres techniques dintelligence artificielle telles que les reseaux de neurones. . . est justifie par leur
capacite à modeliser lincertitude inherente au raisonnement medical et à prendre des
decisions basees sur des donnees incomplètes et de natures differentes (discrète, continue)
[98]. Les applications cliniques mettant en uvre lutilisation les reseaux bayesiens sont
52
variables : de laide au diagnostic à limagerie et au traitement du signal, en passant par

lanalyse de donnees, etc. [99, 100, 101, 102].
Dans le reste de cette section, nous allons presenter les reseaux bayesiens et leur mise
en uvre sur une base de donnees clinique : la base de donnees INDANA [103]. Cette
base de donnees reunit des donnees medicales individuelles (age, sexe, cholesterol. . . ) de
patients presentant une hypertension arterielle avec un suivi sur 7 ans et lenregistrement
de la survenue ou de la non survenue des evenements cardiovasculaires suivants : infarctus,
accident vasculaire cerebral (AVC), mort dorigine cardiovasculaire. Nous entranerons le
reseau bayesien à utiliser ces donnees pour predire le risque cardio-vasculaire, et nous comparerons ses performances par rapport à deux autres methodes utilisees comme temoin :
les reseaux de neurones, et lanalyse discriminante.
2.3.2
Les r
eseaux bay
esiens
Les reseaux bayesiens [50] font partie de la famille des modèles graphiques qui regroupent entre autres : les modèles de Markov caches, les filtres de Kalman, etc. Ces
modèles sont le mariage entre la theorie des probabilites et celle des graphes. Dans cette
section, nous allons commencer par presenter quelques principes et concepts de base des
modèles graphiques. Ensuite nous allons nous focaliser sur un modèle particulier de la
famille des modèles graphiques : les reseaux bayesiens en termes de structure, paramètres
et inference.
Terminologie
Un modèle graphique est un outil utilise pour illustrer visuellement (theorie des
graphes) et representer de facon factorisee une distribution conjointe de probabilites sur un
ensemble de variables dun problème donne (theorie des probabilites) [104]. Un graphe est
compose dune serie de nuds 1 , representant les variables et evenements du monde reel,
connectes par des aretes, representant les interactions entre les nuds, qui peuvent etre
orientees. Dans ce dernier cas, nous pouvons parler de graphe oriente (Directed Graph,
DG).
Une chane est une serie de nuds telle que chacun de ces nuds est connecte à son
predecesseur via une arete. Un chemin est une chane telle que chaque arete est orientee
dans la meme direction que la chane. Un cycle est un chemin qui commence et se termine
au meme nud. Un chemin est dit simple si et seulement si chaque nud est visite
une seule fois. Un cycle est dit simple si, et seulement si, tous ses nuds sont uniques à
lexception du nud de depart et de celui darrivee. Un graphe acyclique oriente (Directed
Acyclic Graph : DAG) est un graphe oriente qui na pas de cycles.
1
Dans la suite du rapport, les termes nuds et variables seront employes de facon interchangeable
53
Dans un DAG, une arete lie un nud, intitule parent, à un autre nud, intitule enfant.
Si X1 est le parent de X2 et X2 est le parent de X3 , alors X1 est un ancetre de X3 et
X3 est à son tour un descendant de X1 . Une famille est formee dun nud X et de ses
parents.
Une foret est un DAG tel que chaque nud a au plus un parent. Un arbre est une
foret o`
u chaque nud a un parent et un seul sauf la racine de larbre. Une corde est une
arete connectant deux nuds non-consecutifs. Un graphe triangule est un DAG o`
u tous
les cycles de longueur 3 ont forcement une corde.
Le terme complet decrit un graphe non-oriente o`
u chaque nud est connecte au reste
des nuds du graphe. Un cluster est simplement un sous-groupe de nuds dans un graphe.
Une clique est le plus grand ensemble de nuds, connectes deux à deux : il sagit dun
sous-graphe complet.
G
en
eralit
es
Un reseau bayesien est une version particulière de modèles graphiques representee sous
forme dun DAG dont les nuds incarnent les objets et evenements du monde reel. Les
relations cause à effet entre les nuds sont representees par des aretes orientees du nud
cause vers le nud effet (Figure 2.11).
Chaque nud a une distribution de probabilite conditionnelle P(Xi |P arents(Xi )) qui
quantifie leffet du parent sur le nud. Une probabilite a priori est affectee aux nuds
racines (sans parents).
Fig. 2.11 Reseau bayesien simple

La specification probabiliste du reseau bayesien passe par la representation dune distribution de probabilite conjointe pour tous ses nuds. Cette distribution conjointe est
defini comme le produit des distributions conditionnelles locales :
P (X1 . . . , Xn ) =
N
Y
P (Xi |P a(Xi ))
i=1
o`
u P a(Xi ) designe lensemble des parents du nud Xi .
(2.4)
54
` partir des probabilites conditionnelles, de la structure du reseau et de la distribution

A
de la probabilite conjointe, nous pourrons alors calculer la probabilite a posteriori quun
nud prend tel ou tel etat. La probabilite a posteriori P (X|Y ) etant donnee la probabilite
a priori P (X) et la probabilite conditionnelle P (Y |X) de Y sachant que X est vrai (true)
est donnee par la theorème de Bayes comme suit :
P (X|Y ) =
P (Y |X)P (X)
P (Y )
(2.5)
Pour configurer un reseau bayesien, il est necessaire de specifier les Distributions des
Probabilites Conditionnelles (CPD) pour tous les nuds ayant des parents et la probabilite
a priori des nuds racines.
Inf
erence et arbre de jonction
Par definition, linference consiste à calculer la probabilite de chaque etat dun nud
dans un reseau bayesien, quand dautres nuds sont observes. Plusieurs algorithmes ont
ete proposes pour realiser linference. Le plus repandu est lalgorithme de larbre de jonction [105, 106, 107].
Fonctionnement Lalgorithme de larbre de jonction est un processus à trois etapes :

transformation, propagation et marginalisation.
1. letape de transformation consiste à construire un arbre de jonction à partir du
reseau bayesien
2. letape de propagation, comme son nom lindique, consiste à propager le vecteur des
valeurs de nuds observes puis à realiser linference sur larbre de jonction
3. letape de marginalisation consiste à marginaliser les variables non-observees du
reseau.
Nous allons illustrer la manière dont lalgorithme procède en reprenant le meme
exemple que dans [55] : il sagit dun reseau bayesien modelisant le comportement du
marche boursier (indice boursier en hausse, en baisse, voire effondre). Ce comportement
est estime par rapport au bug de lan 2000 et est sense modeliser ses repercussions sur
le secteur electrique, les reseaux de telecommunications, les transports, le service public
et le secteur financier (banques) (Figure 2.12). Les rapports dinfluence sont indiques à
` noter quil
travers les liens orientes (cause à effet) entre les diverses variables du reseau. A
ne sagit que dune representation simplifiee dun cas reel beaucoup plus complexe et dans
lequel de nombreux facteurs entrent en jeu.
Transformation en arbre de jonction
55
Fig. 2.12 Reseau bayesien bug an 2000.

Moralisation : la moralisation dun graphe consiste à connecter les parents des nuds
deux à deux et à enlever lorientation des aretes. La moralisation de notre reseau
engendre la creation de 3 aretes supplementaires Rail-Transport aerien, TransportsService public et Transports-Banques (Figure 2.13).
Fig. 2.13 Meme graphe que Figure 2.12 après moralisation.

Triangulation : Un graphe non-oriente est triangule si tous les cycles de plus
de 3 nuds ont une corde. La triangulation est realisee à travers un processus
delimination2 de nuds comme suit :
1. pour i=1 à N (N designe le nombre de nuds)
(a) selectionner le nud qui engendre lajout dun minimum daretes lorsquil
est supprime. Si nous avons le choix entre plusieurs, alors il faut choisir
2
Lelimination dun nud u dans un graphe non-oriente consiste à dabord connecter tous ses nuds
voisins deux à deux et ensuite à supprimer le nud u et toutes les aretes connectees à ce nud
56
celui qui induit le cluster ayant le plus petit poids3

(b) connecter tous les nuds du cluster induit par le nud selectionne
(c) retenir le cluster induit sil nest pas un sous-ensemble dun des clusters
retenus au cours des iterations precedentes
(d) supprimer le nud selectionne du graphe
2. modifier le graphe initial en ajoutant les aretes que nous venons de creer.
La figure 2.14 presente le reseau bayesien moralise et triangularise.
Fig. 2.14 Meme graphe que Figure 2.12 après triangulation.

Construction de larbre de jonction : Les clusters retenus (tableau 2.6) du processus
de triangulation constituent à leur tour les nuds de larbre de jonction. Le problème
reside alors dans la manière de les connecter afin de satisfaire la definition dun arbre
de jonction. Cela peut etre effectue via lalgorithme cite dans [55] comme suit :
1. creer n arbres, chacun contenant une seule clique.
2. pour chaque paire de cliques A et B : creer un separateur, SAB , contenant
lintersection A B
3. recommencer le processus jusquà ce que n-1 separateurs soient crees et inseres
dans la foret, ensuite
(a) selectionner et enlever le separateur SAB ayant la plus grande masse4 de
la liste des separateurs. Si deux separateurs ont une meme masse, alors il
faut supprimer celui qui a le plus petit co
ut5
3
La notion de poids est definie comme suit :
le poids dun nud est defini comme le nombre detats que ce nud peut prendre
le poids dun cluster est le produit des poids de ses nuds
4
5
La masse dun separateur est le nombre de variables quil contient

Le co
ut dun separateur SAB est le poids de A plus le poids de B
57
Tab. 2.6 Illustration du deroulement de lalgorithme de triangulation. Les clusters

retenus pour larbre de jonction sont marques par une etoile (*).
Etape
1
Ar
etes
elimin
ees
Bourse
Ar
etes
ajout
ees
-
Telecom
Electricite-Banques
Transport aerien
Electricite-Transports
4
5
Rail
Electricite
6
7
8
Transports
Banques
Service public
Cluster
induit
Banques, Service public, Transports,
Bourse*
Electricite, Banques, Service public,
Telecom*
Electricite, Transports, Rail,
Transport aerien*
Electricite, Transports, Rail
Service public, Banques, Transports,
Electricite*
Banques, Service public, Transports
Service public, Banques
Service public
(b) si deux cliques A et B se trouvent dans deux arbres distincts de la foret,

alors il faut les connecter en inserant SAB entre eux, ce qui signifie la fusion
des deux arbres
4. larbre final obtenu represente larbre de jonction souhaite (Figure 2.15).
Initialisation du r
eseau
Lorsque larbre de jonction est pret, letape suivante consiste à linitialiser en affectant
des fonctions de potentiels 6 à ses nuds comme suit :
1. pour chaque cluster et separateur, initialiser le potentiel à 1
A 1
2. pour chaque nud u, attribuer un cluster A contenant la famille de u (u et ses
parents). Ensuite, inserer la probabilite conditionnelle P (Xu |Xpa(u) ) dans A comme
suit :
A A .P (Xu |Xpa(u) )
Propagation et marginalisation La marginalisation des nuds du reseau bayesien

se fait à travers un algorithme de propagation globale qui consiste à passer un message
(information nouvelle) dune clique à une autre, filtre à travers les separateurs entre ces
cliques. Un passage de message (message passing) entre deux clusters A et B consiste à :
6
Un potentiel A sur un ensemble de variables Xa est une fonction qui prend lensemble des affectations
possibles des valeurs des variables de Xa et rend une valeur dans lintervalle [0, [
58
Fig. 2.15 Larbre de jonction obtenu à partir du reseau bayesien avec les clusters retenus
du processus de triangulation (ovales) et les separateurs induits (carres).
passer le message du cluster A vers le separateur SAB , ce qui implique la mise à
jour du potentiel du separateur
ancien S
SAB : SAB
AB
SAB A|SAB A
passer le message du separateur SAB vers le cluster B, soit :
SAB
B ancien
B
ancien
S
AB
Introduction dobservations Lobservation (evidence) est representee sous forme

dune fonction de vraisemblance (likelihood ) dune variable Xu notee Xu (xu ) qui est
calculee comme suit :
lorsque la variable Xu est observee, la fonction de vraisemblance est :
Xu (xu ) = {
1
0
lorsque xu est letat observe de

dans le cas contraire
Xu
(2.6)
lorsque Xu nest pas observe, la fonction de vraisemblance est une constante,

Xu (xu ) n1 , pour les n etats xu de Xu .
Lorsquune observation (Xu = xu ) est entree dans le reseau, la mise à jour des fonctions
de vraisemblance se fait de la manière suivante :
59
codage de lobservation sous forme de fonction de vraisemblance nouvelle

Xu
identification du cluster A contenant u et mise à jour de A et Xu comme suit :
1. A A nouvelle
Xu
2. Xu nouvelle
Xu
2.3.3
Apprentissage des r
eseaux bay
esiens
Lapprentissage dun reseau bayesien doit permettre destimer les probabilites conditionnelles de chaque nud du reseau à partir dun echantillon de donnees.
Cas de donn
ees compl`
etes
Dans le cas o`
u toutes les variables sont observees, la methode la plus simple et la plus
utilisee est lestimation statistique qui consiste à estimer la probabilite dun evenement
par la frequence dapparition de levenement dans la base de donnees. Cette approche,
appelee maximum de vraisemblance (MV), nous donne alors :
P (Xi = xk |parent(Xi ) = cj ) = i,j,k =
Ni,j,k
k Ni,j,k
(2.7)
o`
u, Ni,j,k est le nombre devenements dans la base de donnees pour lesquels la variable
Xi est dans letat xk et ses parents sont dans la configuration cj .
Cas de donn
ees incompl`
etes
Dans les applications pratiques, les bases de donnees sont très souvent incomplètes.
Certaines variables ne sont observees que partiellement ou meme jamais. La methode
destimation de paramètres avec des donnees incomplètes la plus couramment utilisee est
fondee sur lalgorithme iteratif EM (Expectation - Maximisation) [108, 109]. Il sagit dune
methode generale doptimisation qui peut etre appliquee dans certains cas de maximum
de vraisemblance (Maximum Likelihood) destimation des paramètres comme suit :
= arg max P(X = x|, M )
(2.8)
o`
u est un vecteur de paramètres, X est une variable aleatoire ayant x comme valeurs
observees, et M est le modèle (reseau bayesien,. . . ).
60
D
eroulement Lalgorithme E.M. est base sur une decomposition du problème doptimisation grace à lintroduction dune variable aleatoire z dite cachee dans le modèle ce
qui rend le problème doptimisation analytiquement faisable.
Toutefois, au lieu dessayer de maximiser la vraisemblance des donnees observees
P (X|), nous allons maximiser la vraisemblance de la distribution jointe de X et Z =
{zi }N
esigne le nombre de classes), P (X, Z|). Nous allons utiliser le logarithme de
1 (N d
cette formule, log(P (X, Z|)). En plus, puisque nous ne pouvons pas connatre les valeurs
des variables aleatoires zi , nous utilisons lesperance (expectation) de cette quantite, soit
une distribution quelconque Q(Z). Lalgorithme E.M. consiste en deux etapes (E-step et
M-step) qui seront executees à chaque iteration comme suit :
E-step Elle consiste à calculer la valeur esperee (expected value) du log-probabilite

de la distribution jointe de X et Z comme suit :
Q(, k ) = EZ [log(P (X, Z|, M ))|X = x, k ]
(2.9)
M-step Au cours de cette etape les paramètres sont mis à jour comme suit :
k+1 = arg max Q(, k )
(2.10)
k designe la serie des valeurs des paramètres obtenues à la kème iteration de lalgorithme.
Ces deux etapes seront repetees jusquà ce que lalgorithme converge vers un maximum : tant que |k k1 | .
2.3.4
Configuration du mod`
ele probabiliste de stratification du
risque cardiovasculaire
Lobjectif est realiser un outil de prediction individualisee du risque cardio-vasculaire,

en vue de le combiner avec le modèle de reseaux de neurones. Nous posons le problème de
la prediction du risque cardio-vasculaire comme un problème dapprentissage supervise
à partir de donnees de suivi de populations à risque, dans lequel levenement à predire
est represente par deux classes, survenue ou non survenue dun evenement cardiaque
(infarctus, accident vasculaire cerebral, mort dorigine cardiovasculaire). Pour realiser cet
objectif nous avons utilise la base de donnees INDANA [103] que nous presentons rapidement ci-après. Puis nous decrivons la structure du reseau bayesien dont nous evaluons
les performances en reference à un modèle neuronal et danalyse discriminante.
2.3.5
61
La base de donn
ees INDANA
La base de donnees INDANA [103] reunit les donnees individuelles de 10 essais

therapeutiques randomises et conduits pour evaluer dans le temps lefficacite de traitements anti-hypertenseurs. Les sujets faisant partie de cette base de donnees ont ete suivis,
en moyenne, sur une periode de 5 ans durant laquelle toute incidence devenements de
nature cardiovasculaire a ete relevee : accident vasculaire cerebral, infarctus du myocarde,
decès par accident vasculaire cerebral, decès par infarctus du myocarde. La survenue dun
evenement cardiovasculaire est code 1, labsence devenement est code 0 (cas controle).
Pour chaque patient, la base de donnees contient, au minium, des donnees
demographiques, medicales et cliniques enregistrees au debut du suivi : age, sexe, pression arterielle systolique et diastolique, indice de masse corporelle, etc., ainsi que les
antecedents dinfarctus du myocarde, daccident vasculaire cerebral, de diabète et de traitement antihypertenseur.
Parmi ces variables, nous en avons retenu 13 pour leur pertinence vis à vis de la
stratification du risque cardiovasculaire. Elles sont listees dans la table 2.7.
Tab. 2.7 Variables retenues pour realiser les modèles de stratification : reseau bayesien,
comite de reseau de neurones et analyse discriminante.
Variable
Age
Type
continu
Pression arterielle systolique
continu
Pression arterielle diastolique
continu
Indice de masse corporelle
continu
Cholesterolemie totale
continu
Taux de glucose sanguin
continu
Sexe
discret
Hypertrophie ventriculaire gauche
discret
Antecedent dinfarctus de myocarde
discret
Antecedent daccident vasculaire cerebral
discret
Antecedent de diabète
discret
Antecedent de traitement antihypertenseur discret
Tabagisme
discret
Evenement cardiovasculaire
discret
Enfin, la base de donnees INDANA a ete divisee de facon aleatoire en 2 sous-ensembles

afin dobtenir un ensemble dapprentissage de 15013 cas pour la configuration du reseau
bayesien et un ensemble de test de 5004 sujets pour evaluer la performance du reseau
bayesien. Les memes ensembles dapprentissage et de test ont ensuite ete utilises pour
62
entraner et tester le modèle danalyse discriminante et un comite de reseaux de neurones.
2.3.6
R
ealisation du r
eseau bay
esien
Un reseau bayesien est un modèle probabiliste causal. En dautres termes, les variables
sont liees par un lien de cause à effet : predecesseurs et successeurs. Pour cette raison,
le choix dune structure modelisant le problème en question est crucial. Meme, si des
algorithmes dapprentissage de structures ont ete developpes, lapproche manuelle reste
la plus fiable et la plus souvent adoptee.
La structure du reseau bayesien a ete determinee de facon manuelle en se basant sur les
connaissances theoriques [9, 11, 110] et le savoir-faire des experts du domaine, notamment
avec laide du docteur Gueyffier de lHopital Cardiologique de Lyon. En effet une serie de
reunions avec le docteur Gueyffier ma permis :
Dabord detudier et analyser la base de donnees INDANA afin dextraire les variables qui pourraient servir dans lelaboration du modèle de stratification du risque
cardiovasculaire.
Ensuite, de determiner les influences en termes de liens de cause-à-effet entre les
diverses variables du modèle.
Enfin, de tester divers configurations de reseaux bayesiens. Ces configurations sont
determinees en fonction du nombre de variables utilisees et les liens causaux entre
ces variables.
A noter que nous aurions pu adopter une des diverses approches de recueil de connaissances utilises surtout dans lelaboration des systèmes experts et des systèmes de gestion de bases de connaissances : les outils et methodes proposes pour aider au transfert
dexpertise (KADS [111], KOD [112],. . . voire ceux permettant dapprendre de nouvelles
connaissances à partir dexemples [113, 114]. Mais du fait quil ne sagit que dun premier
essai pour evaluer la faisabilite dune telle approche, à savoir les reseaux bayesiens, jai
opte pour une simple collaboration avec le cardiologue.
La figure 2.16 illustre le reseau bayesien que nous avons utilise pour stratifier les
facteurs de risque. Ce reseau prend en entree les donnees cliniques, demographiques, lhistorique medical, etc. du patient et donne une estimation du risque de la survenue dun
evenement cardiovasculaire.
Enfin, pour creer notre modèle de reseau bayesien, nous avons utilise le logiciel
BayesialabTM .
63
Fig. 2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire.

R
ealisation du comit
e de r
eseaux de neurones
Notre objectif etant uniquement devaluer la robustesse du reseau bayesien par rapport
à un temoin, nous avons choisi de levaluer par rapport à un comite de 50 reseaux de
neurones que nous avons configure comme suit :
Apprentissage : lapprentissage est realise comme pour linterpretation des ECG
en nous basant sur la methode de Levenberg-Marquardt [87, 88]. Pour eviter le
phenomène de sur-apprentissage, nous avons utilise la methode darret precoce (early
stopping), dejà decrite dans la section 2.2.1.
Fonctions dactivation : comme nous voulons avoir en sortie du reseau des valeurs
comprises entre 0 et 1, nous utilisons par 2 fois des fonctions logarithme-sigmode.
Architecture neuronale : le choix dune seule couche cachee avec 10 neurones sur la
couche cachee semble etre un bon compromis entre la complexite (et donc le temps
de calcul) et la performance du reseau (Figure 2.17).
Le modèle de reseaux de neurones a ete realise avec MatlabTM et la boite à outils
reseaux de neurones de Matlab.
64
Fig. 2.17 Illustration de la structure individuelle des reseaux de neurones utilises pour
estimer le risque cardiovasculaire.
2.3.7
R
esultats
Les trois methodes de stratification du risque cardiovasculaire ont ete evaluees sur
lensemble de test de 5004 cas extrait de la base de donnees INDANA en comparant les
courbes ROC. Levaluation a montre une large superiorite de lapproche bayesienne, avec
une aire sous la courbe ROC de 0.80 contre 0.75 pour le comite de reseaux de neurones
et 0.74 pour le modèle danalyse discriminante.
2.3.8
Discussion
Le choix dun raisonnement probabiliste à base de reseaux bayesiens est justifie pour
deux raisons :
la portabilite : le modèle peut etre facilement etendu à dautres maladies cardiovasculaires. Rappelons que le PEM est à la base configure pour detecter les arythmies
et lischemie.
la simplicite : Au delà de lapprentissage automatique en termes de probabilites
conditionnelles et a priori des facteurs de risque, le fait quil sagit dun modèle
probabiliste graphique permet denvisager que le medecin traitant de lutilisateur
du PEM puisse regler les paramètres du reseau (probabilites a priori, liens causeeffet. . . ) de manière à affecter dun poids plus important un facteur de risque
specifique au patient.
2.3.9
65
Conclusion
Le modèle propose nest quun prototype qui permet detablir une prediction individualisee du risque cardio-vasculaire chez des patients presentant une hypertension arterielle
[115]. Cela signifie que pour une population plus large, dautres facteurs que le modèle
na pas pris en consideration, pourraient influencer la survenue dune maladie cardiaque.
De meme, limpact des facteurs en termes de liens cause-effet pourrait etre different. La
prochaine etape serait donc devaluer le modèle sur dautres bases de donnees, voire de
configurer plusieurs variantes du modèle qui seraient adaptees à une serie de profils types
de lutilisateur du PEM.
2.4
Vers un mod`
ele multi-classifieurs multi-modules
du diagnostic de linfarctus : Interaction du module neuronal et du module bay
esien dans le processus d
ecisionnel global
Lutilisation du module neuronal dinterpretation de lECG avec des seuils de risque

reglables en fonction de la personne utilisatrice du PEM devrait permettre dameliorer la
sensibilite de detection dune ischemie. Cependant, il y a un interet capital à reduire le taux
des faux-negatifs tout en maintenant une sensibilite optimale. Cela nest pas realisable
sans lintroduction du module bayesien avec une interaction suffisamment souple entre les
deux modules. Cest la raison pour laquelle letape finale dans la realisation du module
decisionnel du PEM devrait etre lintroduction dune couche logicielle pilote qui va gerer
linteraction entre les modules et emettre lalarme la plus appropriee. Il sagit dun système
à base de règles traitant tous les cas de figures possibles. Pour realiser ce système, on peut
utiliser une approche classique de règles basee soit sur la logique booleenne soit sur la
logique dite floue.
Dans le PEM, nous envisageons de concevoir un système à base de règles floues [116,
117, 118]. Le choix dune telle technologie est lie au fait que la logique floue permet
dintroduire une graduation dans des notions auparavant soit vraies soit fausses. En effet,
sappuyant sur la theorie mathematique des sous-ensembles flous qui est une extension de
la theorie des ensembles classiques pour la prise en compte densembles definis de facon
imprecise, la logique floue est utilisee dans des domaines aussi varies que lautomatisme, la
robotique, lenvironnement, la medecine (aide au diagnostic), etc. Linteret de la logique
floue est dassurer que les differentes methodes de diagnostic ne soient pas en competition,
mais au contraire, on cherchera à utiliser leur complementarite pour ameliorer le processus
decisionnel. Dans la suite de cette section, nous presentons brièvement la logique floue,
son interet, ses concepts et un exemple de mise en uvre dapplications de règles floues,
ainsi que ce qui pourrait etre le scenario decisionnel global dans le PEM après deploiement
66
` noter que la realisation

des modules neuronal, bayesien et du système de règles floues. A
du système de logique floue et la validation du scenario global necessite davoir une base
de donnees contenant à la fois des ECG seriels, ainsi que des dossiers medicaux exhaustifs
pour chaque patient. Cette base de donnees, en cours de construction, specifique au PEM,
devrait permettre de realiser et valider le modèle decisionnel global presente ci-après.
Le scenario decisionnel global (Figure 2.18) devrait etre comme suit :
Un patient X, presentant un certain nombre de signes de gene se sert de son PEM
pour enregistrer un ECG
Une fois enregistre et charge dans le système, lECG sera interprete par le module
neuronal et un premier score de risque est calcule.
En fonction de ce score, lECG est juge comme : anormal, suspect, ou normal :
Si lECG est anormal, lalarme majeure est declenchee.
Si lECG est normal, un message confortant est emis à lutilisateur.
Si lECG est suspect, le premier score de risque sera conjugue avec un deuxième
score de risque issu du module bayesien et le score de risque global permettra de
declencher lalarme appropriee : majeure, moyenne, mineure.
Cette approche qui est lune des perspectives de recherche future de nos travaux
pour etre evaluee sur la base de donnees qui est en cours de constitution grace aux
experimentations pilotes qui sont actuellement realisees avec les PEM prototypes.
67
Fig. 2.18 Proposition dun modèle decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun système de règles de logique floue.
Chapitre 3
Acquisition de lECG PEM et
synth`
ese de lECG standard
3.1
Introduction
Un des objectifs du projet EPI-MEDICS est de permettre à lutilisateur denregistrer ses propres ECG sans la moindre assistance. Cest la raison pour laquelle le système
denregistrement ECG du PEM est base sur un nombre limite delectrodes (4), faciles à
positionner, correspondant respectivement aux derivations peripheriques (DI, DII) et à la
derivation precordiale V2. Ce système simplifie, pseudo-orthogonal, presente neanmoins
lavantage de recueillir la quasi-totalite de linformation spatio-temporelle de lactivite
electrique cardiaque. Or, dans le cas o`
u une situation dalarme est detectee et envoyee
par le PEM, il est necessaire de rendre lECG critique accessible par le cardiologue destinataire de lalarme, sous forme comprehensible et interpretable, à savoir lECG 12D, qui
est, en pratique clinique, le mode de representation electrocardiologique le plus usite de
par le monde. Il est ainsi essentiel de synthetiser un ECG standard 12D à partir de lECG
3D du PEM. Cette reconstruction doit permettre non seulement une detection precise
de lischemie, mais egalement une reproduction la plus fidèle possible des caracteristiques
quon pourrait avoir dans lECG standard 12D si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM.
La plupart des investigations anterieures sur la synthèse de lECG ont generalement
adopte des techniques de modelisation lineaires telles que la regression multiple. Or, ces
methodes sont très sensibles à la position des electrodes, au bruit musculaire et aux
artefacts causes par les mouvements des bras et du corps, aux interferences avec dautres
appareils,. . . Ces perturbations peuvent produire une difference significative entre les ECG
et par la suite empecher une bonne qualite de synthèse. En outre, les methodes de synthèse
decrites dans la litterature sont quasiment toutes basees sur des methodes dapproximation
par un modèle lineaire [119, 120, 121], alors que le rapport entre les signaux cardiaques
nest pas forcement un processus lineaire [122, 123].
Chapitre 3. Acquisition de lECG PEM et synthèse de lECG standard
69
A notre connaissance, seuls Scherer et al [124] ont abordes le problème de la nonlinearite de la synthèse de lECG standard 12D à partir dun sous-ensemble de derivations
(DI, DII, V2) en proposant une technique de synthèse lineaire par parties obtenue en divisant le signal ECG en quatre portions : le segment PR, le complexe QRS, le segment
ST-T (y compris londe T) et lintervalle TP. Pour chaque portion du signal, un modèle
de regression lineaire multiple calcule une matrice de transformation minimisant lerreur
quadratique moyenne (RMS) entre le signal original et le signal synthetise. Linconvenient
majeur de cette approche concerne les discontinuites introduites au niveau des extremites
de chaque segment, discontinuites qui sont amplifiees par les niveaux des lignes de bases
des derivations DI, DII et V2. Ceci rend la methode de reconstruction extremement sensible aux modifications des tensions de polarisation des electrodes et explique pourquoi
cette methode nest pas utilisee en routine clinique. Cest la raison pour laquelle jai
decide de morienter vers des techniques resolument non-lineaires basees sur des reseaux
de neurones.
Dans la suite de ce chapitre nous allons tout dabord presenter les modalites dacquisition de lECG PEM, puis une methode originale de synthèse de lECG standard 12D à
partir de lECG PEM 3D mettant en uvre des comites de reseaux de neurones artificiels,
Enfin nous evaluerons notre approche comparativement aux methodes traditionnelles de
la litterature.
3.2
Modalit
es dacquisition de lECG PEM
Le système dacquisition de lECG du PEM est base sur le positionnement dit de

Mason-Likar des derivations peripheriques DI et DII, et sur la derivation precordiale
V2.
Les electrodes doivent etre positionnees comme indique dans la figure 3.1 :
Lelectrode JAUNE doit etre placee sur lepaule gauche (à environ 2 cm de
lextremite basse de la clavicule), le plus loin possible du coeur.
Lelectrode ROUGE doit etre placee sur lepaule droite (à environ 2 cm de
lextremite basse de la clavicule), le plus loin possible du coeur.
Lelectrode BLANC doit etre placee dans le quatrième espace intercostal (cestà-dire pour les hommes, approximativement sur la ligne joignant les 2 mamelons),
à peu près à 2 cm à gauche du sternum.
Lelectrode VERT doit etre placee sur la hanche gauche (dans la crete iliaque
gauche).
Lelectrode NOIR doit etre placee sur la hanche droite (dans la fosse iliaque
droite).
Rappelons que le système Mason-Likar est le système de positionnement des electrodes
qui est utilise traditionnellement lors des tests deffort. Ces tests consistent en lenregistrement dun ECG durant le deroulement dun exercice physique calibre. Ils ont pour
70
Fig. 3.1 Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard 12D.
objectif de favoriser lapparition, en continu ou à intervalles programmes, danomalies qui
habituellement ne surviennent quà leffort (maladie des artères coronaires). Pour ce type
de tests, un positionnement des electrodes de facon traditionnelle (12 derivations) est
inadequat à cause du bruit musculaire des bras et des jambes (myogramme). Or, avec le
PEM, lutilisateur est amene à enregistrer ses propres ECG et est donc amene à bouger.
Do`
u linteret du système de Mason-Mikar pour le positionnement des electrodes du PEM.
Cette configuration a ete concue dans le cadre du projet EPI-MEDICS avec le quadruple objectif :
1. dutiliser un nombre minimal delectrodes facile à placer, particulièrement dans des
conditions dutilisation à domicile, en selfcare, en ambulatoire ou en situations
durgence ;
2. de contenir suffisamment dinformations pour diagnostiquer les ischemies et les
arythmies ;
3. de minimiser le nombre de derivations de lECG 12D à synthetiser (autrement dit
de constituer si possible un sous-ensemble de lECG 12D standard) ;
4. doptimiser la qualite de la synthèse des derivations manquantes de lECG 12D.
Elle est basee sur une serie detudes dans le cadre du projet EPI-MEDICS qui ont
permis de demontrer [125] quune configuration pseudo-orthogonale de derivations basee
sur DI, DII et V2 ou sur DI, DII et V3 contient suffisamment dinformations spatiotemporelles pour diagnostiquer lischemie et larythmie si la prise de decision est basee sur des
methodes danalyse multivariee ou de soft computing telles que les reseaux de neurones. Il
a ete egalement demontre au cours du projet EPI-MEDICS [126], quen prenant les coef-
71
ficients de correlation entre les derivations enregistrees et synthetisees comme marqueurs

de la qualite de la reconstruction de lECG standard 12D, que les meilleurs sous-ensembles
de derivations semblent etre (DI, DII, V2), (DI, AVF, V2) et (DI, DII, V3) (tableau 3.1).
Mais du fait quil est plus facile de placer V2, le projet a choisi (DI, DII et V2) comme
meilleur sous-ensemble de derivations du PEM.
Tab. 3.1 Correlations moyennes (en pourcentage) entre les derivations dorigine et
les derivations synthetisees au moyen dun modèle de regression generique en fonction du
sous-ensemble de derivations ECG 12D utilisees comme entrees pour la synthèse. Resultats
extraits de [119] portant sur un ensemble dapprentissage de 72 ECG 12D sans ensemble
de test independant.
Sous-ensemble
DI,DII,V1
DI,DII,V2
DI,DII,V3
DI,DII,V4
DI,DII,V5
DI,DII,V6
DI, AVF,V2
3.3
V1
99.5
98.8
96.2
93.7
95.6
99.4
V2
99.1
98.8
93.5
88.1
91.5
-
V3
98.2
99.2
98.1
93.3
92.9
99.1
V4
97.4
97.9
99,2
98.5
96.1
97.9
V5
99.1
99.1
99.2
99.6
99.0
99.1
V6
99.6
99.6
99.6
99.4
99.4
99.6
m
98.7
99.1
99.1
97.4
94.6
95.0
99.0
Approches conventionnelles
Dans la litterature scientifique, la reconstruction de lECG 12D à partir dun sousensemble de derivations est generalement basee sur une matrice generique de coefficients
calcules à partir dun ensemble dECG provenant de differents patients via des techniques
statistiques telles que la regression lineaire [127, 120, 128, 121]. En outre, differentes
etudes ont conclu que la reconstruction la plus fidèle est realisee à laide dune matrice de
coefficients specifiques derives des ECG du patient [121, 127].
Toutefois, la plupart des methodes developpees pour la synthèse de lECG 12D ont
ete uniquement evaluees à laide des critères de qualite classique tels que les coefficients
de correlation ou lerreur quadratique moyenne RMS (Root Mean Square Error). . . et les
enregistrements ECG 12D qui ont servi à levaluation des resultats etaient les memes que
ceux qui ont servi pour le calcul des coefficients de synthèse (ensembles de test identiques
aux ensembles dapprentissage). Très peu detudes ont essaye devaluer levolution de la
qualite de la reconstruction de lECG dans le temps, o`
u le bruit ou les artefacts causes par
des electrodes mal placees ou les interferences avec dautres appareils. . . , sont susceptibles
de produire une difference significative entre les ECG et par la suite empecher une bonne
qualite de synthèse. En effet, dans le meilleur des cas, la validation a ete effectuee sur
des ECG enregistres au maximum 24h après le recueil des ECG sur lesquels le modèle de
synthèse a ete parametre et en conservant la meme position des electrodes [119].
72
Enfin, à notre connaissance, aucune etude na tente de realiser une evaluation plus
poussee de la qualite de la synthèse en utilisant des descripteurs syntaxiques familiers
aux cliniciens tels que la presence ou labsence dune onde Q, le rapport de R/S. . . ou
en testant limpact de la reconstruction au niveau diagnostique et decisionnel. Il faut en
effet rappeler quen routine clinique le diagnostic electrocardiologique est base de facon
universelle sur des valeurs de paramètres damplitudes et de durees des differentes ondes
dans des combinaisons de sous-ensembles de derivations parmi les 12, en fonction des
types de pathologie. Il est donc très important de pouvoir reconstruire un ECG 12D
standard à partir de lECG PEM 3D afin que ce dernier puisse etre conserve dans le
dossier patient comme un ECG de reference si necessaire. En outre, la grande majorite
des logiciels danalyse automatique de lECG traitant lECG 12D, la reconstruction de
lECG PEM en ECG 12D autorisera son reanalyse eventuelle par dautres programmes.
3.4
Choix m
ethodologiques
Comme le PEM est prevu pour etre utilise à grande echelle et sur le long terme
comme outil daccompagnement quotidien, il fallait tenir compte de ces contraintes en
developpant des methodes de synthèse performantes capable de sadapter à la variabilite
de jour en jour de lECG.
Cependant, si toutes les methodes utilisees pour la synthèse de lECG sont basees sur
la regression lineaire, avec une qualite de synthèse acceptable sur des ECG similaires,
aucune de ces methodes na ete evaluee sur des ECG enregistres dans des conditions
reelles avec le risque de bruit ou dartefacts. Dans de telles conditions, les methodes non
lineaires telles que les reseaux de neurones artificiels (ANN, artificial neural networks)
nous semblaient susceptibles de compenser les faiblesses des methodes lineaires. En effet,
la litterature scientifique est pleine dexemples dans dautres domaines dapplication o`
u
les approches non lineaires ont represente une alternative plus efficace que les approches
dites classiques [129, 130].
De meme, les reseaux de neurones, mis à part leur utilisation comme classifieurs universels, grace à leurs capacites dapprentissage, sont un outil interessant pour lapproximation de fonctions complexes. Plusieurs etudes [131, 132, 133] ont etabli que les reseaux
de neurones multicouches standards avec seulement une couche cachee sont capables dapproximer nimporte quelle fonction, si suffisamment de neurones caches sont disponibles.
Dans ce sens, les reseaux de neurones sont une classe dapproximateurs universels.
Cest pour ces raisons que jai developpe une methode originale de synthèse de lECG
12D basee sur lutilisation des reseaux de neurones artificiels. La methode a deux versions :
une version generique et une version specifique. La version generique a pour objectif de
calculer des coefficients de synthèse etablis à partir de bases de donnees dECG standard
12D. Cette matrice de transformation generique peut etre integree dans le module de
synthèse dECG du PEM lors de linitialisation de loutil.
73
Toutefois, contrairement à la très grande diversite morphologique des ECG interindividus en fonction de lage et du sexe au sein dune meme categorie diagnostique
[134], leur très nette stabilite au cours du temps chez le meme sujet en labsence de nouvelles cardiopathies [135] suggère de fait que la qualite de la reconstruction pourrait etre
amelioree par lutilisation dune matrice de transformation specifique à chaque individu.
La version specifique permet ainsi dobtenir des coefficients de synthèse personnalises à
lutilisateur du PEM. Cela necessite de disposer dau moins un ECG standard 12D de
reference pour le patient en plus de lECG PEM afin detablir la matrice specifique du
patient. Idealement, lECG 12D de reference et lECG PEM devraient etre acquis simultanement pour saffranchir de la variabilite naturelle dun ECG à lautre.
De plus, pour pouvoir tester la qualite de la synthèse sur des ECG autres que ceux
qui ont servi pour lapprentissage il faut disposer, pour chaque patient, dau moins un
deuxième ECG 12D standard et, dune manière generale, de bases de donnees dECG
seriels. Ces bases de donnees seront decrites dans la prochaine section.
3.5
Bases de donn
ees dapprentissage et de test
Pour elaborer et valider nos methodes de synthèse des ECG 12D, nous avons utilise
deux bases de donnees. La première est la base de donnees ECG de Lund, dejà decrite
dans le chapitre 2. La deuxième est une base de donnees composee dECG enregistres sur
des patients hospitalises au service des soins intensifs de lhopital cardiologique de Lyon
[136], identifiee durant le projet EPI-MEDICS sous le nom de la base de donnees CHDB
(Cardiology Hospital in-patients Database).
La base de donnees CHDB contient un total de 386 ECG 3D PEM et de 316
ECG 12D standard enregistres par deux techniciens à moins dune demi-heure dintervalle entre les deux ECG. Lenregistrement est dune duree de 10 sec, avec une
frequence dechantillonnage de 500 Herz. Les ECG 12D ont ete enregistres par un
electrocardiographe numerique standard (CardietteTM ). 50 ECG standard ont ete exclus
parce quaucun ECG PEM na ete enregistre dans un intervalle de temps raisonnable. De
meme, 20 ECG PEM ont ete exclus parce quaucun ECG 12D na ete enregistre sur ces
patients pendant la meme periode. Parmi les 266 paires restantes dECG enregistres sur
les memes patients, 6 paires ont ete exclues parce que les patients avaient un stimulateur
cardiaque et 65 paires dECG ont ete exclues parce que les traces etaient de très mauvaise
qualite. La population detude issue de la base de donnees CHDB consiste finalement
en une serie de 195 paires dECG recueillis sur 131 patients. 85 paires dECG ont ete
enregistrees par le premier technicien et les 110 autres paires par le deuxième technicien.
Les ECG ont ete traites par le programme de Lyon [24] afin dextraire de lenregistrement de 10 sec dorigine, un complexe P-QRS-T type dune duree d1 sec representatif de
lenregistrement de 10 sec. De meme, le programme de Lyon a ete utilise pour determiner
le debut et la fin des ondes P, QRS et T.
3.6
74
Configuration du mod`
ele de synth`
ese de lECG
standard 12D par r
eseaux de neurones
Lobjectif de cette section est de presenter notre methode originale de synthèse de

lECG standard 12D à partir de lECG PEM 3D mettant en uvre des comites de reseaux
de neurones artificiels. Pour construire les reseaux de neurones, un indispensable prealable
est de bien selectionner les echantillons de donnees qui serviront aux apprentissages et aux
validations. Puis nous decrirons larchitecture des reseaux de neurones qui seront utilises
pour la synthèse de lECG standard et la methode utilisee pour configurer leur structure.
Enfin, nous validerons la configuration retenue sur des ECG seriels extraits de la base de
donnees de Lund.
3.6.1
Constitution des ensembles dapprentissage et de test
` partir de la base de donnees de Lund, jai extrait, par selection aleatoire, un premier
A
sous-ensemble de 100 patients appele DS1. Le sous-ensemble DS1 servira à determiner
la meilleure configuration de larchitecture des reseaux de neurones. Deux autres sousensembles de donnees, DS2 et DS3, de 100 patients chacun, seront utilises pour evaluer la
qualite de synthèse des reseaux de neurones. Le sous-ensemble DS2, lui aussi obtenu par
tirage aleatoire, permettra de tester notre methode sur des patients selectionnes de facon
aleatoire, ce qui sous-entend quils sont susceptibles de presenter, en termes devolution,
une grande variabilite intra-patients due à de possibles changements diagnostiques, à des
electrodes mal placees, à une inversion delectrodes. . . entre lECG de reference et lECG
durgence. Le sous-ensemble DS3 est constitue de 100 patients qui nont pas montre de
changements seriels significatifs sur leur 2ème ECG suivant la methode danalyse serielle
CAVIAR [26]. Le sous-ensemble DS3 permet donc de tester notre methode de synthèse
sur des ECG dont on a verifie quils nont pas devolution diagnostique significative ou
dinversion delectrodes.
La population detude est ainsi composee de 300 paires dECG provenant de 112
hommes et 188 femmes, avec un age moyen de 79 ans (40-96 ans), enregistres en moyenne
à un an dintervalle (0-64 mois).
3.6.2
Evaluation de la variation naturelle intra-patients entre

les ECG de r
ef
erence et les ECG durgence
Nos trois sous-ensembles DS1-3 sont constitues dECG seriels enregistres en moyenne
à un an dintervalle. Il pourrait donc y avoir de grandes differences entre les deux ECG.
Il est donc necessaire de verifier si la difference entre les ECG de reference et les ECG
75
durgence nest pas trop grande pour ne pas affecter outre mesure la qualite de la synthèse.
On effectue donc un controle de coherence en calculant, pour chacun des 300 patients,
les coefficients de correlation entre les derivations DI, DII, V1, V2. . . V6 du premier et
deuxième ECG.
3.6.3
Configuration de la structure des r

eseaux de neurones
Le problème de la synthèse des 5 derivations (V1, V3, V4, V5, V6) manquantes à
partir du sous-ensemble des 3 derivations (DI, DII, V2) est un problème dapproximation
de fonction. Or de nombreux travaux de recherche ont montre que les reseaux de neurones
[131, 132, 133], et en particulier les reseaux de type perceptron multicouches, constituent
un outil de choix pour resoudre ce problème dapproximation. Deux solutions sont alors
envisageables : soit utiliser autant de reseaux que de signaux à generer (Figure 3.2(a)),
soit dutiliser un seul reseau à 5 sorties (Figure 3.2(b)). Notre choix sest porte vers la
solution presentee dans la figure 3.2(b). Ce choix est justifie par les raisons suivantes :
1. Sur le plan theorique : Combiner lapproximation des derivations V1, V3. . . V6 (sortie du reseau) à partir des derivations DI, DII et V2 dans un seul et unique reseau
apporte davantage de richesse au niveau du jeu de donnees, au niveau de la combinaison de ces donnees et aura un impact positif sur la configuration des neurones
de la (des) couche(s) cachee(s). En plus, le fait quil y a une forte correlation entre
les derivations spatialement adjacentes (V1-V2, V2-V3, V3-V4,. . . ) confortee par le
fait que les cardiologues, en analysant lECG, analysent les derivations par paires
ou par triplets, justifie le choix de combiner les donnees dans un reseau global.
2. Sur la plan experimental : Une serie de tests prealables nous a permis de confirmer
le constat que le reseau global est meilleur que les 5 reseaux individuels.
Chaque reseau individuel consiste en une couche dentree de 3 neurones (un pour
chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal
derive), et h couches cachees de n neurones (Figure 3.3).
Par ailleurs, il convient de noter que la solution de la synthèse des fonctions V1,
V3. . . V6 au moyen dun reseau multicouches est tributaire à la fois du choix de larchitecture du reseau et de la selection initiale des poids et des biais. Larchitecture sera definie
de manière experimentale au moyen dune serie de tests o`
u lon fera varier le nombre de
couches cachees (h=1, 2), le nombre de neurones par couche cachee (n=3, 5, 8, 10, 15),
et les fonctions dactivation pour les neurones des couches cachees (lineaire ou sigmode).
Concernant la couche de sortie, notre choix sest porte sur des fonctions dactivation
lineaire, à la fois sur la base de considerations theoriques (les relations Vi = f (DI, DII, V2)
sont quasi-lineaires, les signaux sont damplitude crete à crete variable, et peuvent etre
positifs ou negatifs), quau vu des resultats de la revue de la litterature qui indique que
les meilleurs resultats de lapproximation de fonctions au moyen de reseaux de neurones
sobtiennent generalement en utilisant des fonctions dactivation lineaire.
(a)
76
(b)
Fig. 3.2 Differents types de modèles de synthèse de lECG 12D à partir dun sousensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et 1 sortie ; (b)
reseau global avec 3 entrees, 5 sorties.
Pour depasser les limitations de performance inherents au processus dapprentissage

des reseaux de neurones tel que la selection des paramètres initiaux des reseaux, nous avons
comme dans le chapitre precedent, adopte une approche multi-experts, multi-classifieurs
qui consiste à utiliser des comites de N=50 reseaux de neurones artificiels. La sortie du
comite de reseaux de neurones est obtenue en moyennant les sorties des reseaux individuels.
Lobjectif est ici encore, de beneficier des resultats de lapplication du theorème central
limite en combinant les sorties des 50 reseaux individuels pour gommer les differences
globales et dobtenir des performances en termes de qualite de synthèse sensiblement
meilleures que pour chacun des reseaux pris individuellement.
3.6.4
Processus dapprentissage et d
evaluation
Idealement, pour effectuer lapprentissage, nous aurions besoin dau moins 3 ECG
seriels par patient pour deriver un comite de reseaux de neurones specifique au patient :
un premier ECG pour effectuer lapprentissage du reseau, un deuxième pour stopper
lapprentissage afin deviter le surapprentissage, et un dernier pour evaluer la capacite de
generalisation du comite. Malheureusement, les bases de donnees à notre disposition ne
comportent pas plus de deux ECG seriels par patient. Pour surmonter cette difficulte, jai
adopte une strategie en deux temps qui consiste tout dabord à determiner la structure
ideale des reseaux de neurones individuels et le nombre moyen diterations K sur un
ensemble dapprentissage (en fait DS1), puis à evaluer les performances de cette structure
77
Fig. 3.3 Illustration de la structure individuelle des reseaux de neurones utilises pour
la synthèse de lECG 12D : une couche dentree de 3 neurones (DI, DII, V2), une couche
de sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachees de n neurones.
78
ideale sur les deux ensembles de test DS2 et DS3 en stoppant lapprentissage des reseaux
de neurones specifiques au patient au bout dun nombre diterations fixe egal à K.
1. Configuration des comites de reseaux de neurones : Comme indique ci-avant, on
utilise le sous-ensemble DS1 pour determiner la meilleure structure des reseaux du
comite et pour calculer le nombre fixe diterations K à employer. Le processus est le
suivant : On realise, pour chaque patient de DS1 et pour chacun des N=50 reseaux
du comite de reseaux de neurones, un apprentissage sur lECG de reference du
patient. Lapprentissage est arrete lorsque la mesure derreur sur lECG de test (ECG
durgence) du patient commence à crotre. Ce processus est repete pour chacun
des hnt structures (h=nombre de couches cachees ; n=nombre de neurones par
couche ; t=type des fonctions dactivation). La meilleure configuration est celle
qui affiche la plus faible erreur de reconstruction moyenne sur lensemble des 100
ECG test de DS1. Le nombre diterations K est determine en calculant, pour chaque
patient, la moyenne du nombre maximum des iterations pour chacun des 50 reseaux
individuels et en faisant la moyenne de ces valeurs sur les 100 patients du sousensemble DS1.
2. Verification et validation : Le but de cette deuxième etape est de verifier si la
configuration des reseaux (architecture et nombre fixe diterations K) determinee
lors de letape precedente est performante sur dautres sous-ensembles dECG, en
loccurrence, DS2 et DS3. Elle consiste à determiner, pour chaque patient, un comite
specifique de 50 ANN en utilisant les signaux de lECG de reference du patient
comme ensemble dapprentissage. La structure de chaque ANN est celle determinee
lors de letape precedente et le nombre diterations utilise pour lapprentissage est
fixe egal à K.
Les comites de reseaux de neurones elabores sur les ECG de reference des patients de
DS2 et DS3 sont ensuite utilises pour synthetiser à partir des signaux DI, DII et V2
des ECG de test de DS2 et DS3, les signaux V1, V3. . . V6 supposes manquants. Ces
ECG synthetises sont ensuite compares aux ECG originaux à laide dune analyse
quantitative qui consiste à :
(a) Calculer lerreur quadratique moyenne RMS (Root Mean Square) et le coefficient de correlation entre les derivations originales et celles synthetisees sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris).
(b) Comparer ces valeurs par rapport à celles obtenues en utilisant un modèle de
regression multiple specifique du type :
Vi = ai0 + ai1 DI + ai2 DII + ai3 V 2
(3.1)
o`
u aij sont les coefficients specifiques calcules à partir des ECG de reference.
(c) Exclure, pour chacune des 2 methodes et pour chaque derivation, 5% des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.
Cette etape est prevue pour eviter tout biais produit par les cas extremes sur
le calcul des ecarts type et des moyennes [137].
(d) Effectuer des tests statistiques (paired et trimmed paired t-tests) pour verifier si
les differences observees entre les comites de reseaux de neurones et les modèles
de regression multiple sont statistiquement significatives.
3.6.5
79
R
esultats
Evaluation de la variabilit
e naturelle intra-patients entre les ECG de r
ef
erence
et les ECG durgence originaux
Le tableau 3.2 illustre les valeurs des erreurs RMS entre le premier et le deuxième
ECG des sous-ensembles DS1, DS2 et DS3. La valeur moyenne de lerreur RMS sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris) pour les derivations
DI, DII, V1, V2, V3, V4, V5, V6 est de 140 V pour DS1, 149 V pour DS2 et 113 V
pour DS3. Ces chiffres illustrent une variabilite intra-patients entre les ECG de reference
et les ECG durgence plus importante pour les sous-ensembles DS1 et DS2 par rapport à
DS3, ce qui pourrait avoir un effet sur la qualite de synthèse. Ceci sera confirme dans la
partie consacree à levaluation quantitative.
Tab. 3.2 Erreur quadratique moyenne (RMS) en V entre les derivations DI, DII, V1,
V2, V3, V4, V5 et V6 des ECG de reference et ECG durgence des sous ensembles DS1,
DS2 et DS3, après exclusion des 5 valeurs les plus extremes.
D
erivation
DI
DII
V1
V2
V3
V4
V5
V6
RMS moyenne
DS1 (N=95)
85
95
107
194
197
176
149
115
140
DS2 (N=95)
85
84
107
168
219
216
180
134
149
DS3 (N=95)
68
80
86
143
151
145
129
98
113
Meilleure configuration des r

eseaux de neurones : architecture et nombre
moyen dit
erations
La determination de la meilleure configuration dun reseau de neurones est un
problème difficile. De nombreux paramètres entrent en jeu : type de reseau, nombre de
couches cachees (h), nombre de neurones par couche (n), type des fonctions dactivation,
algorithme dapprentissage utilise, critère de mesure de la qualite du reseau.
Le type de reseau (perceptron multi-couches avec 3 entrees et 5 sorties) et le type
de la fonction dactivation de la couche de sortie (fonction lineaire) ont ete fixes dans la
section 3 sur la base de considerations theoriques et pratiques. Concernant lalgorithme
dapprentissage, nous avons choisi une des variantes de lalgorithme de retropropagation
80
fournies par Matlab adapte à lapproximation de fonctions. Il sagit de lalgorithme de

descente de gradient conjugue (scaled conjugate gradient algorithm, SCG) [138]. Enfin,
concernant le critère de qualite, nous avons opte pour la mesure de lerreur quadratique
moyenne (RMS) entre les sorties de chaque reseau de neurones et les signaux correspondants reels provenant des enregistrements ECG durgence de DS1. Dautres critères de
qualite auraient ete possibles (mesure de la qualite diagnostique du signal reconstruit,
differences de signaux en valeur absolue, . . . ), mais ont ete juges trop complexes à mettre
en uvre dans cette etape preliminaire de determination de la meilleure configuration
possible des reseaux de neurones.
La meilleure configuration ANN est determinee experimentalement en effectuant lapprentissage des hnt structures differentes obtenues en faisant varier le nombre de
couches cachees (h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type
de fonction dactivation (t=lineaire, sigmode : tangente sigmode (tansig), logarithmesigmode (logsig)). La fonction dactivation utilisee dans la couche de sortie est lineaire.
Les meilleurs resultats ont ete obtenus pour h=1 couche cachee de n=15 neurones, une
fonction dactivation de type tangente sigmode et K=75 iterations. Les resultats detailles
des performances des hnt structures en termes derreur RMS sur les ECG durgence
de DS1 sont presentes en annexe C.
Evaluation quantitative de la qualit

e de la reconstruction
Pour evaluer quantitativement la qualite de la reconstruction par les reseaux de neurones des 5 derivations ECG (V1, V3,. . . V6) synthetisees à partir des sous-ensembles (DI,
DII, V2) de lECG standard 12D et comparer les resultats avec ceux obtenus au moyen
dune methode de synthèse basee sur la regression multiple, nous avons procede comme
suit :
Nous avons dabord commence par calculer lerreur quadratique moyenne RMS et
le coefficient de correlation (r) entre les derivations originales et celles synthetisees
par les reseaux de neurones. Les calculs sont effectues en considerant la totalite des
signaux à notre disposition c.à.d 1 sec de trace. Nous avons ensuite elimine les 5
cas les plus extremes et compare les valeurs RMS et r par rapport à celles obtenues
avec la methode de regression multiple.
Nous avons enfin effectue des tests statistiques (paired et trimmed t-tests) pour
verifier si la difference observee entre les comites de reseaux de neurones et les
modèles de regression multiple est statistiquement significative.
Les resultats de levaluation quantitative de la performance des comites de reseaux de
neurones et des modèles de regression multiple en termes derreur RMS et coefficients de
correlation sont illustres dans le tableau 3.3. Ces resultats montrent la superiorite de la
synthèse de lECG par reseaux de neurones avec une erreur RMS de 76 (DS1), 100 (DS2)
et 64 (DS3) V en moyenne et une correlation moyenne de 92% (DS1), 91% (DS2) et
97% (DS3) par rapport à celle de la regression multiple avec une erreur RMS moyenne
de 83 (DS1), 108 (DS2), et 73 (DS3) V et une correlation moyenne de 91% (DS1), 90%
81
` noter que la performance est meilleure pour les ECG du sous(DS2) et 96% (DS3). A
ensemble DS3 par rapport à ceux de DS1 et DS2. Cela montre quune grande partie de la
difference observee entre les derivations originales et celles synthetisees pourrait etre due
à des electrodes mal placees ou à un changement physiologique ou diagnostique de letat
du patient dans les sous-ensembles DS1 et DS2.
Le tableau 3.4 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 2 methodes. Daprès ces resultats, dans les deux approches de synthèse,
la difference entre les reseaux de neurones et la regression multiple est statistiquement
significative (p0.001).
Tab. 3.3 Erreur quadratique moyenne (RMS) en V et coefficients de correlation (r)
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux
de neurones specifiques (ANN-S) et les modèles de regression specifiques (REG-S) sur
les ECG des sous-ensembles DS1, DS2 et DS3, après elimination des 5 valeurs les plus
extremes.
A
N
N
S
R
E
G
S
D
erivation
V1
V3
V4
V5
V6
V1
V3
V4
V5
V6
DS1 (N=95)
RMS
r
62
.94
91
.91
92
.88
77
.92
59
.94
64
.93
99
.91
109
.87
85
.91
61
.94
DS2 (N=95)
RMS
r
68
.93
117
.88
127
.88
104
.92
83
.91
74
.93
123
.89
148
.86
112
.91
83
.91
DS3 (N=95)
RMS
r
48
.97
80
.95
80
.96
65
.97
48
.98
55
.96
84
.94
96
.95
76
.96
52
.98
Tab. 3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de la
difference en termes derreur RMS obtenue par les comites de reseaux de neurones et les
modèles de regression specifiques.
Sous-ensembles
DS1 (N=95)
DS2 (N=95)
DS3 (N=95)
Pairwised t-test
< 104
< 103
< 107
Trimmed t-test
< 105
< 105
< 109
3.6.6
82
Discussion
Il est toujours difficile de comparer des resultats devaluation dune nouvelle methode
telle que la methode de synthèse des ECG par ANN à ceux publies dans la litterature
lorsque les bases de donnees utilisees sont differentes. Les resultats vont dependre non
seulement du type de population et des cardiopathies, mais egalement des caracteristiques
techniques de lenregistrement des ECG et des mesures utilisees pour evaluer la qualite de la synthèse. Ainsi les valeurs RMS seront fortement tributaires de la frequence
dechantillonnage et des intervalles ECG consideres. Les coefficients de correlation seront
maximum lorsque lon ne considère que londe QRS, et seront plus faible lorsque lon prend
en compte la totalite des ondes P, QRS et T. Il est donc indispensable de confronter les
resultats dune nouvelle methode par rapport à ceux obtenus avec une methode standard
en utilisant la meme base de donnees et les memes mesures de dissimilarite. Cest ce que
nous avons fait en comparant les resultats de notre methode de synthèse par ANN avec
ceux obtenus en mettant en uvre sur les memes donnees une methode de synthèse par
regression multiple.
Les chiffres les plus realistes publies dans la litterature mentionnent des coefficients de
correlation medians de respectivement r=0.978 pour des traces enregistres à t=0 sec dintervalle (ie lensemble de test est le meme que lensemble dapprentissage) et r=0.953 pour
des enregistrements realises à 24h dintervalle sans changement de position des electrodes
(methode de regression specifique, [119]). Les chiffres que nous avons obtenus sur DS2
sont de respectivement r=0.942 pour la regression lineaire et r=0.947 pour les comites de
reseaux dANN, sachant que, à la difference des resultats publies par Nelwan et al [119],
nos resultats ont ete obtenus sur des traces enregistres en moyenne à 1 an dintervalle et
en considerant 1 sec de traces (soit la totalite des intervalles P, QRS, T) au lieu du seul
intervalle QT.
Quoique non comparables à cause de la nature des ECG de notre population detude,
nous estimons que les resultats que nous avons obtenus tant en termes de coefficients de
correlation moyens que derreurs RMS nous semblent suffisamment probants pour pouvoir
dire que la methode de synthèse par comites de reseaux de neurones specifiques surpasse
très nettement la methode de synthèse par regression specifique et meriterait detre mise
en uvre en routine clinique.
3.6.7
Conclusion
La qualite de la reconstruction de lECG 12D par reseaux de neurones par rapport

à lapproche classique de synthèse par regression lineaire ma encourage à continuer à
effectuer une evaluation quantitative plus poussee de la qualite de synthèse en estimant le
degre dalteration du diagnostic des ECG synthetises par rapport aux ECG de reference.
Dans cette perspective, jai realise une evaluation de lapproche de synthèse par reseaux
de neurones dun point de vue decisionnel en utilisant une population detude composee
83
de plus de 800 paires dECG 12D classes soit dans la categorie apparition dun infarctus
aigue (AMI), soit dans la categorie controles extraits de la base de donnees de Lund. La
methode devaluation et les resultats sont presentes ci-après en section 3.7.
Une autre etape est devaluer les potentialites de notre methode pour synthetiser
un ECG standard 12D à partir de lECG 3D enregistre par le PEM. Cependant, pour
evaluer la qualite des synthèses de lECG standard à partir de lECG PEM, il faut disposer dune base de donnees regroupant à la fois, et pour chaque patient, plusieurs paires
ECG PEM, ECG standard 12D chronologiquement homologues. Idealement chaque paire
dECG devrait etre enregistree de facon synchrone et serielle. Lacquisition des paires
dECG devrait etre effectuee à plusieurs jours voire plusieurs mois dintervalle. Cela nous
permettrait deffectuer une evaluation, à la fois en termes de similarite entre lECG 12D
synthetise à partir de lECG PEM et lECG 12D original, et en termes de contenu diagnostique de lECG synthetise par rapport à celui dorigine. Malheureusement à ce jour,
nous ne disposons pas de telles bases de donnees. Pour circonvenir ce defaut, jai adopte
une approche alternative qui consiste en une evaluation sur un ensemble dECG de la
base de donnees CHDB.
3.7
Evaluation diagnostique sur la base de donn

ees
de Lund
Après avoir teste dans la section precedente, à laide de critères traditionnels de qualite
(erreur quadratique moyenne RMS et coefficient de correlation), la capacite des reseaux
de neurones à synthetiser lECG 12D à partir dun sous-ensemble de derivations (DI, DII,
et V2), lobjectif de cette section est de presenter une evaluation de lapproche de synthèse
par reseaux de neurones dun point de vue decisionnel en utilisant une population detude
extraite de la base de donnees de Lund et composee dECG dinfarctus et dECG de
controle. En dautres termes, il sagit dobserver limpact de la synthèse sur linterpretation
de lECG derive par rapport à celle obtenue sur lECG dorigine correspondant. Pour
cela, je me suis servi dun programme dinterpretation automatique developpe à partir du
modèle presente dans le chapitre precedent (Figure 3.4) :
pour comparer le degre de concordance des interpretations realisees par le programme sur les ECG durgence reconstruits par rapport à la verite clinique, i.e. la
categorie à laquelle appartient lECG durgence dorigine,
pour mesurer la concordance entre les interpretations du programme sur les ECG
durgence reconstruits par rapport à celles realisees sur les ECG durgence dorigine.
Dans le reste de cette section, nous allons dabord presenter les ensembles dapprentissage et de test que nous avons construit pour evaluer la methode de synthèse par reseaux
de neurones. Ensuite, nous allons presenter les protocoles devaluation et enfin les resultats
des evaluations effectuees par rapport à la regression multiple.
84
Fig. 3.4 Programme dinterpretation automatique de lECG suivant 4 niveaux de risque.
3.7.1
Ensemble dapprentissage et ensemble de test
` partir de la base de donnees de Lund, jai extrait le meme sous-ensemble de test,

A
compose de 988 paires dECG (199 cas dAMI et 789 cas de controle) que celui utilise
pour tester la methode de diagnostic par reseaux de neurones developpee dans le chapitre
2. Ensuite, jai elimine toutes les paires dECG contenant des blocs (cest à dire avec
une duree de londe QRS superieure à 120 ms). Lensemble de donnees final est donc
compose de 808 paires dECG enregistres en moyenne à un an dintervalle (0-7 ans),
provenant de 411 hommes et 397 femmes avec un age moyen de 71 ans (40-95 ans).
Parmi ces 808 patients, 151 ont developpe un infarctus aigue lors de leur admission dans
le service durgence et comme explique dans le chapitre 2, leur ECG durgence a ete
classe dans la categorie infarctus. En consequence, nous avons classe les 151 paires dECG
correspondants dans la categorie dinfarctus (AMI), et les 657 paires dECG restants dans
la categorie de controle. Dans la suite, nous appelons ensemble dapprentissage, lensemble
forme des 808 ECG de reference et ensemble de test, lensemble des 808 ECG durgence
correspondants.
3.7.2
85
Configuration et apprentissage des comit

es de r
eseaux de
neurones sp
ecifiques aux patients
Pour synthetiser les derivations (V1, V3, V4, V5, V6) à partir du sous-ensemble de
derivations (DI, DII, V2), jai utilise comme precedemment des comites de 50 reseaux de
neurones artificiels. Larchitecture de chaque reseau individuel, lalgorithme dapprentissage ainsi que le nombre diterations sont ceux decrits dans la section 3.6.
Pour chacun des 808 patients de la population detude, un comite de reseaux de neurones specifique au patient est calcule. Lapprentissage des reseaux est effectue sur lECG
de reference avec un nombre diterations fixe pour eviter le sur-apprentissage. LECG
durgence va ensuite servir pour evaluer la capacite de generalisation du comite.
3.7.3
Comparaison des interpr

etations automatiques des ECG
synth
etis
es par rapport `
a la v
erit
e clinique
Ce premier test a pour objectif devaluer la qualite de la synthèse par comites de

reseaux de neurones et par regression en mesurant la concordance entre la verite clinique
des ECG originaux durgence et le diagnostic obtenu par application du programme dinterpretation automatique developpe dans le chapitre precedent. Le protocole devaluation
que nous avons mis en uvre commence par extraire les 808 ECG durgence classes en
deux categories : infarctus et controle de la base de donnees, puis à creer les deux ECG de
synthèse en appliquant tour à tour les deux types de transformations specifiques, comites
de reseaux de neurones et regression multiple. Ensuite, la deuxième etape est lapplication du logiciel de diagnostic sur les ECG generes par les methodes de synthèse, ainsi que
sur les ECG originaux. Le programme classifie les ECG en 4 categories suivant le risque
dinfarctus : pas de risque, risque mineur, risque moyen et risque majeur. La troisième
etape consiste à combiner les ECG appartenant aux deux premières categories : pas de
risque et risque mineur, et à les considerer comme ECG de controle. De meme, les ECG
appartenant aux categories restantes : risque moyen et majeur, sont consideres comme
etant des ECG dinfarctus. La dernière etape est la comparaison de linterpretation automatique par rapport à la verite clinique. Cette comparaison est realisee par le biais de
courbes ROC. Pour chacun des 2 ensembles dECG : ECG reconstruits par comites de
reseaux de neurones et ECG reconstruits par regression, une courbe ROC est calculee. Le
degre de concordance entre verite clinique et interpretation automatique est mesure par
laire sous la courbe ROC. Plus laire sous la courbe ROC est elevee, plus la methode de
synthèse est performante.
La figure 3.5 illustre les courbes ROC resultant de la comparaison de linterpretation
automatique des 808 ECG durgence de la population detude reconstruits par reseaux
de neurones et par regression par rapport à la verite clinique sur les ECG originaux.
La performance, mesuree par le biais de laire sous la courbe ROC, est respectivement
86
0.9
0.8
Sensibilit
0.7
0.6
0.5
0.4
0.3
0.2
Comit spcifique, aire = 0.862

Rgression spcifique, aire = 0.854
0.1
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1Spcificit
Fig. 3.5 Courbes ROC resultant de la comparaison entre la classification des ECG
derives par reseaux de neurones et par regression, par rapport à la verite clinique des
ECG originaux correspondants.
0.862 pour les ECG synthetises par reseaux de neurones et 0.854 pour ceux synthetises
par regression. Ces resultats sont remarquablement eleves car à peine inferieurs à ceux
obtenus sur les ECG originaux (aire de 0.872), avec un net avantage de la methode de
synthèse par reseaux de neurones par rapport à la regression.
Comparaison des interpr

etations automatiques des ECG synth
etis
es par rapport aux interpr
etations automatiques des ECG dorigine
Le deuxième test devaluation de la qualite de la synthèse par comites de reseaux
de neurones et par regression a pour objectif de mesurer la concordance entre les interpretations des ECG synthetises et les interpretations des ECG durgence originaux. Ce
test permettra de verifier si notre methode de synthèse permet de reconstruire des ECG
renfermant suffisamment dinformation diagnostic pour que les logiciels dinterpretation
automatique fournissent des diagnostics concordant à ceux qui seraient obtenus sur les
ECG originaux.
Le tableau 3.5 illustre les cas de concordance (elements sur la diagonale de la matrice
de confusion) et de discordance dinterpretation entre les ECG dorigine et les ECG derives
par reseaux de neurones et par regression.
Lanalyse des resultats nous apprend deux choses :
1. La qualite de synthèse realisee par les comites de reseaux de neurones permet une
87
meilleure concordance dinterpretation entre ECG originaux et synthetises par rapport à la performance realisee par la methode de regression.
2. Tous les elements de la matrice de confusion, en dehors de la tridiagonale, sont nuls
ce qui signifie que les interpretations entre lECG original et les ECG de synthèse ne
different au maximum que de un degre dans lestimation de la qualite de lischemie,
et donc quil ny a pas de discordance sevère entre les interpretations. Le fait que
le diagnostic puisse passer dune categorie à la categorie adjacente est dautant plus
probable que la sortie des ANN est proche des seuils de decision.
Tab. 3.5 Concordance entre les interpretations des ECG originaux et les interpretations
des ECG synthetises par reseaux de neurones (ANN-S) et par regression (REG-S). Le
logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de risque, risque
mineur, moyen et majeur.
Original
ANN-S
pas de risque (374)
risque mineur (209)
risque moyen (119)
risque majeur (106)
REG-S
pas de risque (379)
risque mineur (212)
risque moyen (113)
risque majeur (104)
3.7.4
pas de risque
(383)
risque mineur
(219)
risque moyen
(110)
risque majeur
(96)
351
32
0
0
22
160
36
1
1
17
76
16
0
0
7
89
350
32
1
0
29
158
32
0
0
22
73
15
0
0
7
89
Discussion & Conclusion
Après avoir prouve au cours de la section 3.6 la faisabilite de lapproche de synthèse de

lECG standard 12D à partir dun sous-ensemble de derivations par le biais de comites de
reseaux de neurones, cette section vient renforcer les premières constatations de lefficacite
de lapproche. En effet, la deuxième phase devaluation exposee dans cette section a montre
que les comites de reseaux de neurones depassent en qualite de synthèse les methodes
pronees par la litterature scientifique [121, 128], basees sur la regression multiple. De
plus, les ECG 12D derives à partir du sous-ensemble de derivations : DI, DII et V2
contiennent suffisamment dinformation diagnostic et sont suffisamment similaires aux
ECG 12D dorigine pour permettre une concordance dinterpretation très elevee. Encore
faut-il tester lefficacite de la methode à synthetiser lECG standard 12D à partir de lECG
3D enregistre par le PEM dEPI-MEDICS. Autrement dit, il sagit de prouver la capacite
de la methode des comites de reseaux de neurones à synthetiser des ECG 12D à partir
dECG 3D enregistres dans un contexte de telemedecine citoyenne. Ce sera lobjectif de
la prochaine et dernière etape de validation que nous presentons ci-après.
3.8
3.8.1
88
Evaluation de la qualit
e de la synth`
ese des ECG
standards 12D `
a partir des ECG 3D du PEM
Objectifs
Si linteret de notre approche de synthèse dECG par reseaux de neurones est dejà
prouve, letape logique suivante est devaluer la performance de la methode sur les ECG
3D du PEM enregistres à plusieurs jours dintervalle, tenant compte des conditions dacquisition des ECG et dun minimum de variabilite de jour en jour de lECG. Rappelons
que le système dacquisition de lECG du PEM est base sur le positionnement de MasonLikar des derivations peripheriques DI et DII, et sur la derivation precordiale V2, et que
lutilisateur est amene à enregistrer ses propres ECG et est donc amene à bouger.
Levaluation de la qualite de la synthèse de lECG standard 12D à partir de lECG
PEM 3D sera effectuee sur un sous-ensemble dECG 12D et PEM 3D de la base de
donnees CHDB que nous decrirons dans la section suivante. Cette evaluation va consister
tout dabord à utiliser des critères traditionnels de qualite (erreur quadratique moyenne
RMS et coefficient de correlation) pour mesurer la capacite des reseaux de neurones à
synthetiser lECG 12D à partir dun sous-ensemble de derivations (DI, DII, et V2) du
PEM. Toutefois, la mise en uvre de cette approche nest pas simple. En effet, pour pallier
aux contraintes liees à lutilisation de deux appareils differents (PEM pour les ECG 3D et
Cardiette pour les ECG 12D) pour enregistrer les ECG et au fait que lenregistrement des
deux ECG (12D et 3D) nest pas synchronise, il est indispensable de recourir dabord à un
procede dalignement des signaux avant de pouvoir effectuer des mesures des differences
entre les derivations reconstruites et celles de reference. Ensuite, nous effectuons une
evaluation dun point de vue diagnostic pour tester limpact de la synthèse sur la qualite
de linterpretation. Ceci sera realise en mesurant la concordance entre les interpretations
elaborees par le programme dinterpretation automatique, developpe dans le chapitre 2,
sur les ECG 12D reconstruits à partir des ECG PEM 3D, et les interpretations realisees
sur les ECG Cardiette dorigine. Ces dernières sont considerees comme etant la verite.
De plus, par rapport aux sections precedentes, nous presenterons deux versions de
la methode de synthèse : une version generique ayant pour objectif de calculer des coefficients de synthèse etablis à partir dun ensemble dECG standard 12D, ainsi quune
version specifique permettant dobtenir des coefficients de synthèse personnalises à lutilisateur du PEM à partir de ses propres ECG. En effet, lors de la première utilisation du
PEM, il est probable que lon ne dispose pas encore de transformation specifique, et il est
donc important de savoir sil faut plutot utiliser une matrice de transformation generique
obtenue par regression multiple ou une methode de synthèse basee sur des comites de
reseaux de neurones.
3.8.2
89
Population d
etude
Pour constituer notre population detude, nous avons extrait de la base de donnees
CHDB une serie de paires dECG en appliquant un ensemble de règles decrites ci-après.
Rappelons, en preambule, que la base de donnees CHDB contient, après un premier
controle de qualite et de coherence, 195 paires dECG provenant de 131 patients. Chaque
patient possède une, deux, voire plusieurs paires dECGs (Tableau 3.6). Chacune des
paires consiste en un ECG standard 12D et en un ECG PEM 3D base sur les derivations
DI, DII et V2.
Tab. 3.6 Description de la base de donnees CHDB.
195 paires dECG (3D et 12D) pour 131 patients
Nb de patients
Nb de paires par patient
83
1
36
2
9
3
2
4
1
5
Contr
ole de qualit
e et de coh
erence
Interpr
etation des ECG par des experts humains Chaque ECG 12D de la base de
donnees CHDB a ete interprete de manière independante par un cardiologue experimente.
Chaque ECG a ete classe dans lune des deux categories suivantes :
1. ACS (Acute Coronary Syndrome), si un syndrome coronarien aigu (ACS) a ete
diagnostique sur lECG.
2. Controle, si lECG enregistre provenait dun patient pour lequel le diagnostic etait
autre que ACS.
Les 195 ECG standard 12D ont ete classes en respectivement 60 cas diagnostiques
ACS et 128 cas de controle. Les 7 cas restants nont pu etre diagnostique et ont
donc ete elimines de notre base de donnees.
A lissue de cette etape, notre ensemble de donnees est forme de 188 paires dECG provenant de 130 patients se repartissant ainsi :
1. 83 patients ont 1 paire dECG,
2. 39 patients ont 2 paires dECG,
3. 5 patients ont 3 paires dECG,
4. et 3 patients ont 4 paires dECG.
90
Nous avons donc subdivise la base CHDB en deux sous-ensembles : SE1 est forme des
83 patients de la population detude ayant une seule paire dECG PEM 3D et Cardiette
12D et SE2 est forme des 47 patients ayant au moins deux paires dECG PEM et Cardiette.
Pour les 8 patients du sous-ensemble SE2 ayant plus de deux paires dECG, nous navons
retenu que les deux premières paires dECG 3D et 12D à condition quelles aient ete
enregistrees à au moins 1 jour dintervalle. SE2 est donc constitue de 472 paires dECG
provenant de 47 patients. Les 94 paires dECG standard et les 94 paires dECG PEM ont
ete enregistres en moyenne à 3 (1-21) jours dintervalle.
Processus de contr
ole de la coh
erence entre les ECG PEM et les ECG 12D
standards Du fait que lenregistrement des ECG nest pas synchrone et en raison du
statut cardiaque très evolutif typique des patients dans un service de soins intensifs, il
pourrait y avoir de grandes differences entre les deux ECG PEM et 12D, souvent acquis à
quelques dizaines de minutes dintervalle, et plus encore pour les cas de SE2, o`
u les deux
paires dECG ont ete enregistrees jusquà 3 jours dintervalle. Ces differences pourraient
affecter de manière considerable la mesure des ecarts entre les ECG de synthèse et les
ECG 12D dorigine, surtout en cas dapparition de troubles de la conduction ou du fait
de levolution dune ischemie aigue. Les differences imputables à levolution de letat cardiaque pourraient en effet etre beaucoup plus importantes que celles dues aux algorithmes
de reconstruction des derivations manquantes.
Lobjectif de cette etape est donc de verifier si la difference entre les ECG PEM et Cardiette nest pas trop grande et deliminer les paires denregistrements dont les differences
depassent un certain seuil, pour eviter de fausser les mesures de la qualite de la synthèse.
Le controle de coherence est effectue comme suit : pour chacun des 47 patients du sousensemble SE2, une analyse de correlation est effectuee entre les derivations DI, DII, V1,
V2. . . V6 du premier et deuxième ECG Cardiette et entre les derivations DI, DII et V2
du premier ECG Cardiette et du deuxième ECG PEM. Enfin, une troisième et dernière
analyse de correlation est effectuee entre les derivations DI, DII et V2 du deuxième ECG
Cardiette et de lECG PEM associe. Les traces sont juges coherents si aucun des coefficients de correlation entre deux derivations chronologiquement homologues nest inferieur
à 0.2, seuil etabli de facon experimentale sur la base de donnees etudiee. A la suite de
cette etape, 10 patients ont ete elimines du sous-ensemble SE2. Lensemble de donnees
final consiste donc en une serie de (83+37) 157 paires dECG collectees sur 120 patients
(82 hommes, 38 femmes ; moyenne dage ecart type = 61 15 ans). Un syndrome coronarien aigu (ACS) a ete diagnostique sur 46 (29%) des 157 ECG standard 12D : (SE1 :
21 ECG ACS et 62 ECG de controle et SE2 : 25 ECG ACS et 49 ECG de controle).
3.8.3
Pr
etraitement des ECG
Pour aligner les traces ECG issus du PEM et des electrocardiographes 12D, nous avons
tout dabord aligne les debuts des QRS (determines par le programme de Lyon) des deux
91
traces puis nous avons evalue, au moyen dun algorithme de correlation croisee (cross
correlation) [139] le decalage entre les deux enregistrements en analysant les segments
allant du debut de londe Q jusquà la fin de londe T (QT) des derivations V2 des deux
signaux comme suit (Figure 3.6) :
Calcul de la correlation croisee dans lintervalle QT.
Estimation du decalage entre les deux signaux par la localisation de la valeur maximale de la fonction de correlation.
Utilisation du decalage calcule par correlation croisee pour aligner toutes les
derivations des ECG PEM et Cardiette.
3.8.4
Configuration de la structure des r

eseaux de neurones
Pour synthetiser les derivations (V1, V3, V4, V5, V6) à partir du sous-ensemble
de derivations (DI, DII, V2) enregistrees par le PEM, nous avons utilise comme
precedemment un ensemble de comites de 50 reseaux de neurones artificiels constitues
de perceptrons multi-couches (PMC). Lapprentissage des PMC est effectue à laide dun
algorithme de retropropagation supervisee (scaled conjugate gradient algorithm, SCG).
Chaque reseau consiste en une couche dentree de 3 neurones (un pour chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal derive), et 1 couche
cachee de 15 neurones. En dautres termes, il sagit de la meme configuration que celle que
nous avions obtenue lors de levaluation sur la base de donnees de Lund dans les sections
precedentes.
3.8.5
Processus dapprentissage
g
en
eriques
des
r
eseaux
de
neurones
Pour palier au fait que nous ne disposions que dun nombre restreint dECG standard
12D (83 ECG), nous avons adopte un processus dapprentissage du comite de reseaux
de neurones generiques mettant en uvre une technique de validation croisee (crossvalidation), dejà expliquee dans le chapitre 2, comme suit : lensemble des 83 ECG 12D de
SE1 est divise en M=10 sous-ensembles egaux et disjoints. Ensuite, pour I = 1 à M, chaque
reseau individuel du comite realise un apprentissage sur les M 1 sous-ensembles restant et
lerreur est calculee sur le sous-ensemble I, servant de validation. Les ECG des M 1 sousensembles sont juxtaposes pour former un enregistrement ECG artificiel continu. Larret
de lapprentissage est realise en surveillant lerreur de reconstruction (erreur quadratique
moyenne, RMS) sur le sous-ensemble restant I, o`
u les ECG ont ete egalement juxtaposes
pour former un enregistrement ECG continu. Le cycle dapprentissage est repete tant que
lerreur obtenue en sortie sur les donnees de lensemble de validation I est decroissante.
La procedure est repetee N fois pour chacun des reseaux du comite. Un nombre fixe
diterations K est alors determine en memorisant pour chacun des MN apprentissages le
nombre diterations et en calculant la moyenne de ces valeurs. Enfin, lapprentissage des
Fig. 3.6 Illustration de lalignement des signaux ECG par correlation croisee.
92
93
N=50 PMC est refait en utilisant la totalite de lensemble de donnees SE1 et en prenant
comme critère darret le nombre fixe diterations calcule lors de letape precedente (Figure
3.7).
3.8.6
Processus dapprentissage
sp
ecifiques
des
r
eseaux
de
neurones
Comme dejà indique plus haut, lideal serait davoir au moins 3 ECG seriels par patient
pour realiser un apprentissage specifique au patient. Or avec SE2, nous ne disposons au
maximum que de 2 enregistrements seriels par patient. Pour compenser ce manque de
donnees, nous avons adopte la meme strategie que pour la base de donnees de Lund
en utilisant comme critère darret de lapprentissage un nombre fixe diterations K. En
pratique nous avons retenu la valeur de K que nous avons calcule sur les 83 ECG 12D de
SE1, soit K=56. Pour chacun des 37 patients du sous-ensemble SE2, nous avons configure
un comite de reseaux de neurones specifiques. Lapprentissage de chacun des N=50 reseaux
du comite est effectue sur le premier ECG 12D. Cet apprentissage est conditionne par le
nombre fixe diterations K.
3.8.7
V
erification et validation de la synth`
ese de lECG 12D
Pour verifier la capacite de generalisation des deux versions generique et specifique de

notre methode de synthèse de lECG par comites de reseaux de neurones, nous avons teste
les deux types de comites sur la deuxième paire dECG 12D et ECG PEM des 37 patients
du sous-ensemble SE2 (la deuxième paire dECG par patient). Quatre synthèses sont
realisees au total pour chacune des paires dECG en appliquant tour à tour les comites de
reseaux de neurones generiques puis specifiques aux derivations DI, DII et V2 de lECG
Cardiette et de lECG PEM. La qualite de ces synthèses sera evaluee à deux niveaux :
1. Evaluation quantitative par mesures de similarite : il sagit devaluer la similarite
entre les signaux dorigine et ceux synthetises à laide de mesures du type erreur
quadratique moyenne (RMS) et coefficient de correlation. Pour cette comparaison,
nous avons utilise lintervalle QT (en fait Q-onset -18 à T-offset + 38 msec) de
lECG (Figure 3.8).
Les mesures derreur et de correlation obtenues sur les ECG synthetises par comites
de reseaux de neurones generiques et specifiques sont ensuite comparees par rapport à celles obtenues en utilisant des modèles de regression multiple generiques et
specifiques. Ensuite, pour chacune des 4 methodes et pour chaque derivation, 5%
des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.
Enfin, deux tests statistiques, paired et trimmed paired t-tests, sont effectues pour
determiner si les differences enregistrees entre les deux approches sont statistiquement significatives.
94
Fig. 3.7 Illustration de lapprentissage et de la validation des comites de reseaux de

neurones generiques et specifiques.
95
Fig. 3.8 Visualisation des intervalles de temps utilises pour lapprentissage des comites
de reseaux de neurones generiques et specifiques (PT : P-Onset -18 à T-offset +38 msec)
et pour tester leur capacite de generalisation (QT : Q-onset -18 à T-offset +38 msec). En
cas dabsence de londe P, on remplace le pointeur P-onset par un pointeur virtuel tel que
lintervalle PQ correspondant à lintervalle PQ moyen.
2. Evaluation diagnostique : lexactitude de la reconstruction de lECG 12D est evaluee
au niveau diagnostique en mesurant le degre de concordance entre les resultats
de linterpretation automatisee de lECG de reference et ceux obtenus sur lECG
synthetise. Cette interpretation est realisee de la meme facon que pour la base de
donnees de Lund en utilisant le programme de diagnostic developpe dans le chapitre
2 pour classer respectivement les ECG derives par voie generique et ceux generes
par voie specifique à laide des comites de reseaux de neurones et des modèles de
regression multiple. Nous comparons ensuite les interpretations des ECG synthetises
au moyen des modèles de transformations generiques et specifiques aux resultats
de la stratification en deux groupes (controle et infarctus) des ECG de reference,
realisee par le meme programme que ci-dessus, resultat qui sera considere comme
etant la verite. La meilleure methode de synthèse est celle qui fournit la meilleure
concordance.
3.8.8
R
esultats
Evaluation de la variabilit
e inter-patients naturelle des ECG
Le tableau 3.7 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier et le deuxième ECG standards de SE2 enregistres à 3 jours dintervalle
en moyenne en unite de soins coronariens. La valeur moyenne de lerreur RMS dans
lintervalle QT (Q-onset -18 à T-offset +38 msec) pour les derivations DI, DII, V1, V2,
96
V3, V4, V5, V6 est de 106 V. Le coefficient de correlation est 0.92 en moyenne.
Les deux tableaux suivants presentent les resultats entre chacun de ces ECG Cardiette
et le deuxième ECG PEM, afin dobserver une double confrontation.
Le tableau 3.8 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier ECG Cardiette et le deuxième ECG PEM. La valeur moyenne de lerreur
RMS dans lintervalle QT pour les derivations DI, DII et V2 est de 107 V. Le coefficient
de correlation est de 0.87 en moyenne.
Enfin, le tableau 3.9 illustre les valeurs des erreurs RMS et des coefficients de
correlation entre le deuxième ECG Cardiette et lECG PEM associe. La valeur moyenne
de lerreur RMS au niveau de lintervalle QT pour les derivations DI, DII et V2 est de 80
V. Le coefficient de correlation est 0.93 en moyenne.
Tab. 3.7 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre
les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxième ECG
Cardiette du sous ensemble SE2, après elimination des 5% des cas les plus extremes
(N=35).
Cardiette 1 vs Cardiette 2
D
erivation RMS ()
r ()
DI
60 ( 30)
.93 () 0.09
DII
73 ( 32)
.85 () 0.18
V2
125 ( 58) .95 () 0.07
V1
V3
V4
V5
V6
82 ( 44)
135 ( 57)
136 ( 56)
139 ( 59)
100 ( 41)
.95
.95
.92
.90
.91
()
()
()
()
()
0.08
0.04
0.08
0.13
0.10

les derivations DI, DII et V2 du premier ECG Cardiette et du deuxième ECG PEM du
sous ensemble SE2 (N=35).
Cardiette 1 vs PEM 2
D
erivation RMS ()
r ()
DI
93 ( 42)
.84 () 0.18
DII
98 ( 39)
.83 () 0.19
V2
130 ( 64) .94 () 0.07
97

les derivations DI, DII et V2 du deuxième ECG Cardiette et de lECG PEM associe du
sous ensemble SE2 (N=35).
Cardiette 2 vs PEM 2
D
erivation RMS ()
r ()
DI
78 ( 38)
.88 () 0.16
DII
74 ( 36)
.92 () 0.11
V2
87 ( 33)
.98 () 0.03
Ces resultats illustrent tout dabord la variabilite de jour en jour de lECG standard
12D (Cardiette 1 vs Cardiette 2). Cette variabilite est accentuee avec lintroduction du
positionnement Mason-Likar pour lECG PEM sur les derivations DI et DII (Cardiette
1 vs PEM 2). Ce double effet va avoir des consequences importantes sur la qualite de la
synthèse de lECG standard.
Evaluation quantitative
D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII, V2)
de lECG Cardiette Les resultats de levaluation quantitative en termes derreur RMS
et coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees à
partir de (DI, DII, V2) de lECG Cardiette 2 de SE2 en utilisant tour à tour le comite de
reseaux de neurones et le modèle de regression generiques deduits à partir des ECG 12D
de SE1 sont illustres dans le tableau 3.10. Ces resultats montrent une legère superiorite de
la synthèse des ECG par reseaux de neurones, avec une RMS moyenne de 122 V dans le
segment QT versus une RMS moyenne de 126 V pour la regression generique. Au niveau
de la correlation entre les derivations synthetisees et les derivations originales, les deux
methodes affichent une performance à peu près similaire avec une correlation moyenne de
0.93.
Levaluation quantitative des comites de reseaux de neurones et des modèles de
regression specifiques est illustree dans le tableau 3.11. Ces resultats montrent une assez
nette superiorite de la synthèse dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 94 V dans lintervalle QT, par rapport à la regression specifique avec une
RMS moyenne de 108 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synthèse par reseaux de neurones specifiques affiche des
correlations superieures à celles de la regression specifique avec des correlations moyennes
de respectivement 0.96 et 0.95 dans lintervalle QT.
erreurs RMS des 4 methodes. Daprès ces resultats, seule lapproche de synthèse specifique
98

les derivations V1,V3. . . V6 originales et celles synthetisees par le comite de reseaux de
neurones generique (ANN-G) et le modèle de regression generique (REG-G) sur les ECG
2 du sous-ensemble SE2 (N=35).
V1, V3. . . V6 `
a partir de DI, DII et
M
ethode D
erivation RMS ()
A
V1
87 ( 42)
N
V3
108 ( 50)
N
V4
171 ( 77)
V5
152 ( 65)
G
V6
96 ( 44
R
V1
88 ( 42)
E
V3
111 ( 49)
G
V4
176 ( 73)
V5
157 ( 63)
G
V6
98 ( 45)
V2 Cardiette
r ()
.97 () 0.02
.97 () 0.03
.88 () 0.14
.91 () 0.09
.93 () 0.07
.97 () 0.02
.96 () 0.04
.88 () 0.09
.90 () 0.07
.92 () 0.08

les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux de
neurones specifiques (ANN-S) et les modèles de regression specifiques (REG-S) sur les
ECG du sous-ensemble SE2 (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 Cardiette
M
ethode D
erivation RMS ()
r ()
A
V1
68 ( 30)
.98 () 0.02
N
V3
93 ( 45)
.98 () 0.02
N
V4
114 ( 45)
.95 () 0.05
V5
112 ( 42)
.95 () 0.04
S
V6
84 ( 34)
.95 () 0.04
R
V1
75 ( 33)
.98 () 0.02
E
V3
99 ( 46)
.97 () 0.02
G
V4
140 ( 55)
.92 () 0.07
V5
132 ( 46)
.93 () 0.05
S
V6
93 ( 40)
.94 () 0.06
5
* p 0.01, ** p 10 (paired t-tests)
99
affiche une difference statistiquement significative (p< 106 ) entre les reseaux de neurones
et la regression multiple.
Tab. 3.12 Comparaison par les t-tests (pairwised et trimmed) de la difference en termes
derreurs RMS obtenues par les comites de reseaux de neurones et les modèles de regression
generiques et specifiques (N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S
0.236
< 106
0.066
< 107
D
erivations pr
etis
ees `
a partir de (DI, DII, V2)
de lECG PEM Les resultats de levaluation quantitative en termes derreur RMS et
coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees à partir
de (DI, DII, V2) de lECG PEM 2 au moyen du comite de reseaux de neurones generique
et du modèle de regression generique derives comme precedemment à partir des ECG
Cardiette de SE1, sont illustres dans le tableau 3.13. Ces resultats montrent une legère
superiorite de la synthèse dECG par reseaux de neurones generiques, avec une RMS
moyenne de 131 V dans lintervalle QT, par rapport la regression generique avec une
et les derivations originales, la synthèse dECG par reseaux de neurones generiques affiche
une superiorite plus nette avec une correlation moyenne de 0.92 dans lintervalle QT, par
rapport à la regression generique avec une correlation moyenne de 0.90.
Levaluation quantitative des comites de reseaux de neurones specifiques et des modèles
de regression specifiques est illustree dans le tableau 3.14. Ces resultats montrent la
superiorite de la synthèse dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 118 V dans lintervalle QT, par rapport la regression specifique avec une
et les derivations originales, la synthèse par reseaux de neurones specifiques affiche une
correlation superieure à celle de la regression specifique avec une correlation moyenne de
respectivement 0.93 et 0.92 dans lintervalle QT.
erreurs RMS des 4 methodes. Daprès ces resultats, seule lapproche de synthèse specifique
affiche une difference statistiquement significative (p< 0.05) entre les reseaux de neurones
et la regression multiple.
La qualite de la synthèse affichee par notre approche de comites de reseaux de neurones ne semble pas etre globalement très superieure à celle de lapproche traditionnelle
de regression lineaire, en particulier au niveau generique. Cependant, vu le fait que dans
notre etude les ECG sont enregistres suivant deux systèmes dacquisition differents :
100

les derivations V1,V3. . . V6 originales des 2ème ECG 12D de SE2 et celles synthetisees à
partir des ECG PEM chronologiquement homologues par le comite de reseaux de neurones
generique (ANN-G) et le modèle de regression generique (REG-G) (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 PEM
M
ethode D
erivation RMS ()
r ()
A
V1
108 ( 49) .96 () 0.03
N
V3
120 ( 59) .96 () 0.03
N
V4
169 ( 72) .88 () 0.14
V5
156 ( 66) .89 () 0.09
G
V6
104 ( 40) .90 () 0.09
R
V1
113 ( 51) .95 () 0.03
E
V3
121 ( 62) .96 () 0.04
G
V4
172 ( 67) .88 () 0.11
V5
157 ( 64) .88 () 0.09
G
V6
105 ( 43) .89 () 0.09
* p 0.05 (paired t-test)

les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux de
neurones specifiques (ANN-S) et les modèles de regression specifiques (REG-S) sur les
ECG du sous-ensemble SE2 (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 PEM
M
ethode D
erivation RMS ()
r ()
A
V1
90 ( 35)
.95 () 0.04
N
V3
120 ( 61) .97 () 0.02
N
V4
147 ( 69) .91 () 0.09
V5
132 ( 53) .92 () 0.05
S
V6
99 ( 43)
.91 () 0.09
R
V1
102 ( 42) .94 () 0.05
E
V3
110 ( 50) .96 () 0.03
G
V4
164 ( 72) .89 () 0.10
V5
150 ( 58) .90 () 0.07
S
V6
103 ( 47) .90 () 0.10
* p 0.01 (paired t-test)
101
positionnement standard pour lECG 12D et positionnement Mason Likar pour lECG
PEM et lintroduction dun dephasage d
u à lasynchronisme existant entre les horloges
dechantillonnage des dispositifs denregistrement PEM et Cardiette, la difference devient
plus evidente. En effet, ces contraintes ont genere une difference moyenne en termes derreur RMS de 76 V et une correlation moyenne de 0.90 entre les derivations originales
DI et DII des ECG 12D et ECG 3D chronologiquement homologues (tableau 3.9). Leffet
Mason-Likar sur DI est plus important que la variabilite de jour en jour de lECG standard 12D (tableau 3.7). Par ailleurs, il convient de remarquer que les valeurs RMS et les
correlations des derivations V1, V3. . . V6 synthetisees par les comites ANN-S à partir des
traces PEM 2 sont tout à fait comparables à celles mesurees entre les traces Cardiette
1 et Cardiette 2 (tableau 3.7). On peut donc penser que lon pourrait encore ameliorer
les resultats si lon construisait des reseaux specifiques sur des ECG 12D enregistres en
position Mason-Likar.
Tab. 3.15 Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la
difference en termes derreurs RMS obtenues par les comites de reseaux de neurones et
les modèles de regression generiques et specifiques lorsque les entrees sont des ECG PEM
(N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S
0.193
< 0.05
0.164
< 0.03
Evaluation diagnostique sur SE2

D
erivations pr
etis
ees `
a partir de (DI, DII,
V2) de lECG Cardiette 2 Le tableau 3.16 illustre le degre de concordance entre les
interpretations automatiques des ECG Cardiette originaux de SE2 (2ème enregistrement)
et celles des ECG 12D synthetises par le comite de reseaux de neurones generiques et
par le modèle de regression multiple generique à partir des derivations DI, DII et V2
de lECG Cardiette original lorsquon considère linterpretation des ECG Cardiette 2
originaux comme etant la verite. De meme, le tableau 3.17 illustre le degre de concordance
entre linterpretation automatique des ECG Cardiette originaux et celle des ECG 12D
synthetises par les comites de reseaux de neurones specifiques et les modèles de regression
multiple specifiques.
Les resultats de levaluation de limpact de la synthèse sur le contenu diagnostique de
lECG montrent une concordance globalement elevee entre les interpretations des ECG
synthetises et celles des ECG de reference. Les matrices de confusion sont quasiment
tridiagonales, à lexception dun seul cas diagnostique respectivement comme presentant
un risque majeur sur lECG 12D dorigine et un risque mineur sur les ECG de synthèse
102
sauf pour la synthèse par regression specifique o`

u il est classe dans la categorie risque
moyen. 31 ECG de synthèse sur 37 sont diagnostiques à lidentique de lECG 12D original.
Sur les 6 cas restants, 5 se retrouvent dans des classes adjacentes de part et dautre de
la diagonale de la matrice de confusion. Cette tridiagonalite sexplique en partie par la
nature des règles daffectation à une classe qui sont basees sur des seuils appliques à la
sortie du comite de reseaux de neurones. Il suffit quun cas soit à la limite du seuil de
decision pour quun epsilon de variation des traces, donc des paramètres, le fasse changer
dune categorie à lautre. Par ailleurs, il convient de noter aussi que certains paramètres
de type syntaxique (tels que les amplitudes et les durees des ondes Q, R, S, R, S,. . . )
mesures sur lECG sont très sensibles à de petites variations. A titre dexemple, en cas
de presence dun morphotype de type QRS ou RS avec une toute petite onde R, une
très faible modification de londe R ou du niveau de la ligne de base peut conduire à des
modifications consequentes des paramètres mesures (Figure 3.9).
Comme dejà evoque dans le chapitre 2, lintroduction de fonctions dappartenance
floue permettrait sans doute dattenuer ces changements intempestifs de categorie lies
aux seuils de decision utilises pour mesurer les paramètres ECG de nature syntaxique
(relatifs aux ondes Q, R, S,. . . ) ou pour categoriser un ECG en lune ou lautre des
classes de diagnostic.
(a)
(b)
Fig. 3.9 Incidence de la methode de synthèse de lECG sur la calcul des paramètres
ECG de type syntaxique. A gauche sur lECG dorigine, le trace presente une petite onde
R et une grande onde S. A droite, sur lECG de synthèse, aspect typique dit QS. Londe
R, microvoltee, na pas ete detectee et par consequent la duree de londe Q est passee de
0 à 92 msec et celle de londe S de 70 msec à 0.
D
erivations pr
etis
ees `
a partir de (DI, DII,
V2) de lECG PEM 2 Le tableau 3.18 illustre le degre de concordance entre les
interpretations automatiques des ECG Cardiette 2 Originaux et celles des ECG 12D
synthetises à partir des derivations DI, DII et V2 de lECG PEM chronologiquement
homologue (ECG PEM 2) par le comite de reseaux de neurones generiques et le modèle
de regression multiple generique, linterpretation des ECG Cardiette 2 etant consideree
comme etant la verite. De meme, le tableau 3.19 illustre le degre de concordance entre
les interpretations automatiques des ECG Cardiette 2 originaux et celles des ECG 12D
synthetises par les comites de reseaux de neurones specifiques et les modèles de regression
103
Tab. 3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises à partir des derivations DI, DII et V2 de lECG 12D Cardiette 2 par le comite
de reseaux de neurones generiques (ANN-G) et par le modèle de regression generique
(REG-G). Le logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de
risque, risque mineur, moyen et majeur.
Original
ANN-G
pas de risque (8)
risque mineur (14)
risque moyen (6)
risque majeur (9)
REG-G
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
6
0
0
0
2
13
0
0
0
0
4
1
0
1
2
8
5
1
0
0
2
13
0
0
0
0
4
1
0
1
1
9
Tab. 3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les modèles de regression specifiques (REG-S).
Original
ANN-S
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)
REG-S
pas de risque (6)
risque mineur (16)
risque moyen (5)
risque majeur (10)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
5
1
0
0
2
13
0
0
0
0
4
1
0
1
1
9
5
1
0
0
1
14
0
0
0
1
3
1
0
0
2
9
104
multiple specifiques.
Tab. 3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits à
partir des derivations DI, DII et V2 de lECG PEM 2.
Original
ANN-G
pas de risque (5)
risque mineur (12)
risque moyen (13)
risque majeur (7)
REG-G
pas de risque (6)
risque mineur (13)
risque moyen (10)
risque majeur (8)
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
3
2
1
0
1
8
6
0
1
1
2
1
0
1
4
6
3
2
1
0
2
9
4
0
1
1
2
1
0
1
3
7
Bien que moins probants, ces resultats sont neanmoins satisfaisants car 34 cas sur
37 cas se retrouvent ici encore sur la tridiagonale de la matrice de confusion. Deux cas
supplementaires montrent un changement de categorie diagnostique qui va au delà de la
categorie adjacente. Ainsi un cas passe de la categorie pas de risque à la categorie risque
moyen, un autre passe de la categorie risque moyen à la categorie pas de risque.
Comme pour levaluation quantitative, le fait davoir utilise des ECG enregistres à
plusieurs minutes dintervalle avec deux systèmes dacquisition differents, ie un positionnement des electrodes DI et DII standard pour lECG 12D et Mason Likar pour lECG
PEM 3D, parfois des electrodes mal-placees. . . a pu generer des differences importantes
entre les derivations originales DI et DII des ECG 12D et ECG 3D. Cette variabilite, très
importante dans certains cas, a empeche une bonne qualite de synthèse et a d
u alterer
le contenu diagnostique des ECG. Si lon prend comme critère de qualite le pourcentage
de diagnostics sans changements de categorie (ie la somme des elements de la diagonale
des matrices de confusion divisee par le nombre total de cas analyses, soit 37), ANN-S
semble plus performant que REG-S, mais pas plus performant que ANN-G. De facon surprenante, la regression generique (REG-G) avec 21/37 classes à lidentique, semble etre
la methode la plus performante. Ces resultats sont cependant à prendre avec precaution
car avec seulement 37 cas, lensemble de test nest pas suffisamment representatif pour en
tirer des conclusions definitives.
105
Tab. 3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits à
partir des derivations DI, DII et V2 de lECG PEM 2.
Original
pas de risque
(6)
risque mineur
(15)
risque moyen
(5)
risque majeur
(11)
4
1
1
0
2
6
7
0
1
1
2
1
0
1
3
7
4
1
1
0
3
4
8
0
1
1
2
1
0
1
3
7
ANN-S
pas de risque (7)
risque mineur (9)
risque moyen (13)
risque majeur (8)
REG-S
pas de risque (8)
risque mineur (7)
risque moyen (14)
risque majeur (8)
3.9
Discussion
Comme le demontre la figure 3.10, La qualite de reconstruction par notre methode

de synthèse de lECG 12D par comites de reseaux de neurones artificiels specifiques est
excellente compte tenu du faible nombre de derivations qui ont servi pour realiser la
synthèse et le fait que les ECG ont ete enregistres dans de vraies situations cliniques, par
des techniciens differents et avec diverses configurations de positionnement des electrodes.
En effet, les differences de similarite entre les ECG originaux et ceux synthetises se sont
averees principalement dues à des electrodes mal placees ou explicables par les differences
de positionnement des electrodes peripheriques selon le système de recueil dit de MasonLikar versus des electrodes fixees aux extremites des membres et par consequent nont
pas perturbe le diagnostic dans la majorite des cas. Par ailleurs, malgre le fait quau
niveau generique, les reseaux de neurones nont pas depasse en performance la regression
multiple, nous croyons que notre approche peut etre optimisee en utilisant une base de
donnees dECG plus grande et plus representative lors de la phase dapprentissage.
De plus, la marge de progression reste consequente, tant au niveau des collectes dECG
plus adaptes (au moins 3 ECG seriels. . . ) que du pretraitement des donnees, de loptimisation de lapprentissage via des techniques dapprentissage selective [96], evolutive
[95]. . .
3.10
106
Conclusion
Dans ce chapitre, nous avons presente letude exhaustive dune methode originale
de synthèse de lECG 12D par application de comites de reseaux de neurones artificiels
que jai developpe au cours de ma thèse. Les evaluations quantitatives et cliniques de la
methode ont demontre son interet majeur dans le cadre dun scenario de telemedecine :
acquisition dun ECG simplifie à domicile ou en ambulatoire, et generation de lECG
standard 12D correspondant.
Les performances enregistrees par la methode de reseaux de neurones sur des ECG
12D seriels ou des ECG 12D et ECG PEM enregistres dans des conditions simulant celles
dutilisation du PEM (cest à dire en ambulatoire ou à domicile, acquisition par le patient,
son entourage ou un/une aide soignant(e), avec un positionnement delectrodes different
de celui de lECG standard 12D), ont largement depasse les methodes conventionnelles
publiees dans la litterature. Les premiers resultats des experimentations de la methode
de synthèse ont ete presentes lors de la conference internationale IEEE Computers in
Cardiology 2004 [140]. Un deuxième article, sur levaluation sur la base de donnees CHDB,
a ete soumis pour publication à la revue internationale Methods of Information in Medicine
[141], et un troisième article est en cours de redaction.
107
V1
V3
V4
V5
V6
REG G
REG S
Original
ANN S
ANN G
Fig. 3.10 Illustration de la qualite de synthèse de lECG standard 12D à partir de lECG
PEM 3D.
Chapitre 4
Mise en place de la plateforme
d
ecisionnelle du PEM
4.1
Objectifs
Dans ce chapitre, nous allons principalement exposer et traiter les problèmes liees au
deploiement des methodes dintelligence artificielle abordees dans les precedents chapitres,
dans la plateforme logicielle du système.
Une première problematique est liee à la creation des modules de calcul du risque
cardiovasculaire : il sagit du module neuronal dinterpretation de lECG PEM, du
module bayesien de quantification des facteurs de risque à partir des donnees du
dossier medical de lutilisateur du PEM, et de la couche de collaboration entre les
deux modules suivant un système à base de règles de logique floue.
Une deuxième problematique est liee au deploiement du module de synthèse de
lECG 12D à partir de lECG PEM 3D enregistre par lutilisateur (citoyen/patient)
lui-meme, avec le minimum dassistance professionnelle.
Une troisième problematique est de rendre laide à la decision dans le système
adaptee à la specificite de chaque utilisateur.
Les autres problematiques liees à la generation dalarmes et de leur niveau, la gestion de
lenvoi des alarmes tenant compte des non-reponses eventuelles des serveurs dalarme ou
des professionnels de sante contactes. . . seront brièvement abordes.
Chapitre 4. Mise en place de la plateforme decisionnelle du PEM
4.2
109
Etat actuel de d
eveloppement du PEM `
a l
etape
de prototype
Quatre-vingt prototypes du PEM ont ete construits et evalues selon differents scenario
dutilisation dans differents centres, à Lyon, Brescia, Catania, Lund et Trento, dans des
services durgence, des unites de soins intensifs, des cliniques de cardiologie, en medecine de
ville, au domicile du patient et en ambulatoire, par differents professionnels (cardiologues,
generalistes, techniciens ECG, infirmières,. . . ) et par des patients eux-memes [7, 47].
Dans la suite de cette section, nous allons decrire les fonctionnalites et services disponibles dans le PEM à letat actuel de developpement.
4.2.1
Le PEM : intelligence embarqu

ee dans un environnement
pervasif multi-acteurs de t
el
em
edecine citoyenne
Le projet EPI-MEDICS a developpe un PEM intelligent et pervasif pour la detection

precoce de la survenue devenements cardiovasculaires chez les patients et citoyens utilisateurs du système. La plateforme decisionnelle embarquee dans le PEM permet : la
detection des arythmies, le diagnostic des ischemies, la generation dalarmes, et la gestion intelligente des messages dalarmes de manière à assurer un acheminement securise
et dans les plus courts delais aux professionnels de sante appropries : SAMU, medecin
traitant. . . (Figure 4.1)
Fig. 4.1 Le PEM (Personal ECG monitor) au service de la prevention et la detection

precoce de la survenue devenements cardiovasculaires.
4.2.2
110
Architecture pervasive g
en
erique
Pour permettre une communication pervasive entre les acteurs de lapplication (utilisateur du PEM, SAMU, cardiologue, etc.) communiquant à laide de divers outils (PEM,
telephone portable, PDA, etc.), EPI-MEDICS a realise une architecture generique basee
sur les technologies dInternet (TCP/IP) et le meta-language XML pour la representation,
le stockage et la communication des donnees [6, 142].
Larchitecture pervasive dEPI-MEDICS (Figure 4.2) consiste en une application principale installee sur un serveur web dont le principal objectif est dassurer la gestion de
lechange des messages, et des applications clients distribuees, la communication etant
securisee grace au protocole HTTPS. Un message contient une partie liee à la communication, une copie du dossier de sante electronique, et tout autre fichier attache tel quun
ECG au format SCP-ECG. Pour assurer la bonne reception de linformation dans un delai
acceptable, larchitecture permet dacheminer partout, differents types de notification par
le biais des divers moyens et technologies de communication de lère actuelle (Pager, SMS,
PDA, etc.).
Fig. 4.2 Un exemple darchitecture dEPI-MEDICS : un serveur web assure la gestion

intelligente des echanges de messages, et des applications clientes distribuees servant à
envoyer et à recevoir les demandes XML de tele-expertise via HTTPS.
4.2.3
111
G
en
eration et gestion dalarmes
Differents niveaux dalarmes sont generes suivant la severite de levenement cardiaque :

alarmes majeure, moyenne, mineure, ou pas dalarme.
Les alarmes de niveau majeur (infarctus aigu, arythmies sevères) sont transmises au
SAMU ou à lun des centres durgence identifies et stocke dans le PEM en utilisant
Bluetooth et GPRS via le telephone portable de lutilisateur (Figure 4.3). Sont transmis
en priorite :
1. un message dalarme indiquant la cause et le degre de gravite de lalarme ;
2. les donnees permettant didentifier et de localiser le patient ;
3. lECG qui a ete la cause de la generation de lalarme ;
4. le dossier medical du patient, notamment ses antecedents cardiaques et ses facteurs
de risque ;
5. lECG de reference (sil existe) ;
6. un descriptif des symptomes cliniques (si le patient a eu le temps de les documenter) ;
7. lECG precedant lECG anormal (si specifie par les paramètres denvoi du patient).
Fig. 4.3 Scenario dalarme majeure.

Dans le cas dune alarme de niveau moyen (suspicion dischemie, arythmie atypique),
lensemble des informations (ECG PEM et le dossier medical electronique embarque) est
envoye à un serveur dalarmes (Figure 4.4) qui envoie dès reception un SMS au medecin
traitant (cardiologue ou generaliste) identifie dans la liste des contacts du patient embarquee dans le PEM. Ce SMS indique la raison et limportance du niveau dalarme, le
numero du telephone portable du patient, ladresse du serveur dalarmes (couramment :
http ://pem-alarm.insa-lyon.fr ou http ://pemalarm. univ-lyon1.fr), un identifiant de 6
chiffres generes aleatoirement et un mot de passe choisi aleatoirement dans un dictionnaire de mots courants de 6 à 8 caractères. Le medecin traitant peut alors se connecter
au serveur dalarmes au moyen dInternet, visualiser lensemble des informations disponibles pour ce patient au moyen dun simple browser Web, et prendre les decisions qui
112
simposent : contacter le patient, requalifier le niveau dalarme en alarme majeure en

demandant au serveur denvoyer lensemble des informations au SAMU, demander une
tele-expertise auprès dun confrère, copier le ou les ECGs stockes temporairement sur le
serveur dalarme dans le dossier medical du patient. . .
Fig. 4.4 Scenario dalarme moyenne.

Dans le cas dune alarme de niveau mineur, le PEM affiche un message invitant lutilisateur à signaler ce message à son medecin traitant à loccasion dune prochaine visite à
son cabinet. Le contenu du message est archive dans le PEM en meme temps que lECG
et les resultats de lanalyse quantitative et le medecin pourra par la suite telecharger et
visualiser lECG concerne.
Enfin, si la probabilite du risque cardiovasculaire nest pas significative, le PEM emet
un message reconfortant au patient : pas de risque, etat cardiaque normal.
4.2.4
D
etection des arythmies et des isch
emies
La detection des arythmies est basee sur un système à base de règles de logique floue.
Le module dinterpretation du rythme cardiaque, concu mais pas encore implante dans le
PEM, calcule les variations de lECG PEM par rapport à un ECG de reference. Suivant
la categorie auquel correspond lutilisateur du PEM, à savoir, athlète professionnel1 , sujet
sain, sujet avec des antecedents darythmies dans le passe, sujet souffrant de problèmes
cardiaques, le module applique une serie de règles standards utilisees pour detecter larythmie. Ces règles originalement faites en logique booleenne ont ete traduites en logique floue
1
Il est en effet connu que lECG dun sportif professionnel est très different de lECG dun sujet de
meme age, du meme sexe et de meme categorie diagnostique mais non sportif. En particulier, le segment
ST peut presenter des decalages par rapport à la ligne de base de lECG avoisinant les critères dischemie
chez un sujet sain, sportif professionnel
113
pour permettre plus de flexibilite et sensibilite dans linterpretation.

La detection des ischemies est basee sur lutilisation de comites de reseaux de neurones
artificiels de respectivement 100 reseaux pour lanalyse unaire et 75 pour lanalyse serielle.
Lanalyse unaire nest invoquee que si aucun ECG de reference nest disponible. Les
reseaux de neurones sont representes suivant un format texte, developpe dans le cadre
dEPI-MEDICS. Ce format contient la description de tous les paramètres des reseaux de
neurones (poids, biais, fonctions dactivation) afin de rendre possible son deploiement.
Enfin, un logiciel, simulant le fonctionnement des reseaux de neurones, charge les reseaux
du comite, recupère les paramètres unaires/seriels et lance linterpretation de lECG PEM
[143].
4.2.5
Reconstruction de lECG standard 12D `

a partir de lECG
PEM 3D
Lors de lenregistrement dun ECG, le PEM peut detecter un disfonctionnement cardiaque et contacter un centre dappel (SAMU) ou un professionnel de sante (medecin
traitant). Comme nous lavons dejà explique, le PEM est concu pour envoyer lECG responsable du declenchement de lalarme dans un format comprehensible et interpretable
par les cardiologues, à savoir lECG standard 12D, encode suivant la norme SCP-ECG.
Pour assurer la reconstruction de lECG standard, un module de synthèse, base une matrice de transformation generique, a ete embarque dans le PEM.
Au cours du projet EPI-MEDICS, diverses approches de synthèse ont ete evaluees
ou developpees, dont notamment la methode de reconstruction par reseaux de neurones
que jai developpe et presente dans ce rapport de thèse. Cette methode originale et très
prometteuse a ete testee sous Matlab mais na pas encore ete implementee dans le PEM.
Une etude va etre menee pour determiner la meilleure strategie de deploiement, du fait du
co
ut de calcul que necessite lapprentissage de comites de reseaux de neurones à grande
echelle (tous les futurs utilisateurs du PEM). Quelques reponses sont fournies dans la
suite de ce chapitre.
4.3
Vers un produit final : strat

egies de d
eploiement
du module de synth`
ese de lECG embarqu
e dans
le PEM
Dun point de vue technique, lintegration des technologies danalyse multivariee telles
que les reseaux de neurones dans un système daide à la decision tel que le PEM pour
realiser un module de synthèse de lECG tend à etre co
uteux en termes despace memoire
114
et de temps de calcul, particulièrement pendant la phase dapprentissage des reseaux

de neurones. Cependant, une fois le processus dapprentissage realise, la synthèse dun
enregistrement ECG de 10 sec ne prend quenviron 5 sec sur un ordinateur Pentium IV
de 2 GHz sous Matlab. Cette duree de traitement sera alors encore bien reduite en phase
operationnelle en utilisant le langage C.
Dautres part, il faut savoir que lobjectif principal de la synthèse dECG nest pas la
prise de decision dans le PEM mais plutot la reproduction la plus fidèle possible dun ECG
12D correspondant à lECG PEM critique afin de le rendre interpretable par le cardiologue
destinataire. Dans le PEM, la reconstruction des derivations (V1, V3, . . . V6) manquantes
permet de produire un enregistrement ECG compatible au standard SCP-ECG qui sera
stocke dans la carte memoire du PEM.
Deux types de solutions pourraient etre utilises pour realiser le module de synthèse
de lECG par reseaux de neurones, suivant notre perception de loperabilite du PEM :
système complètement autonome ou semi autonome.
4.3.1
Le PEM, un dispositif autonome
La puissance de calcul de linformatique embarquee a progresse enormement cette

dernière decennie approchant aujourdhui les capacites de calcul dun Pentium III de
800 MHz. Ce potentiel de calcul pourrait nous permettre de doter le PEM dun moteur
dapprentissage des reseaux de neurones. Ce moteur utiliserait les bases de donnees dECG
propre à lutilisateur du système pour mettre à jour le jeu de paramètres des comites de
reseaux de neurones specifiques.
4.3.2
Le PEM, un dispositif semi-autonome
Bien que le choix dun dispositif complètement autonome semble etre seduisant, une
etude de linteret de lintroduction de telles puissances de calcul et surtout de son impact
au niveau du prix unitaire de lappareil, devrait etre effectuee.
Une solution moins co
uteuse et plus facilement evolutive au niveau materiel mais qui
peut etre plus compliquee à mettre en place du point de vue logiciel, consiste à se servir
des moyens de communication integres dans le PEM (Blue Tooth, GPRS, serveur web
. . . ) pour permettre la communication de donnees entre le PEM et les professionnels de
sante. De tels moyens permettent denvoyer les ECG collectes par le patient à un serveur
web sur lequel chaque patient disposerait dun dossier medical electronique ainsi que de
sa propre base de donnees ECG. Ces donnees peuvent etre dynamiquement mises à jour
et revisees au moyen de technologies de grilles de calcul et de services web.
115
Service web et grille de calcul : grille pervasive

La technologie service web en informatique m
edicale Par definition, un service
web est une entite logicielle concue pour permettre linteraction fluide et transparente
entre des applications heterogènes à travers un reseau. Un service web est dote dune
interface decrite dans un format interpretable par les machines : le format WSDL. Les applications interagissent avec le service web moyennant des messages en SOAP2 , transmis
via HTTP avec une serialisation XML en conjonction avec les standards Web. Larchitecture des services web comprend trois technologies emergentes : SOAP, WSDL3 , et UDDI4 .
Un processus service web typique inclut :
un fournisseur de services (provider) qui deploie les services web representant la
gamme de services, applications et specificites systèmes fournies par ce fournisseur,
et qui seront publiees dans un registre UDDI,
un demandeur de service (requester) qui fouille le registre à la recherche du service
requis et pourrait par la suite etre mis en lien avec le fournisseur.
Les services web fournissent une base de reference commune pour deployer, representer
et formater à la fois les entrees et les sorties des donnees des applications dinformatique
medicale existantes.
Lapport de linfrastructure grille de calcul Linteret majeur dune plateforme

de synthèse dECG est de permettre une application à grande echelle de lapprentissage
neuronal afin de configurer un dispositif de transformation specifique à chaque utilisateur du PEM. Cependant, un tel objectif nest pas realisable sans la mise en uvre
de ressources de calcul suffisantes. Do`
u linteret de faire appel à une infrastructure à
base de grille de calcul. Une grille de calcul est une infrastructure materielle et logicielle qui fournit un accès consistant, pervasif et non co
uteux à des ressources de traitement consequentes. Au cours des 5 dernières annees, les outils de developpement et de
deploiement des applications de grille de calcul sont devenus de plus en plus nombreux :
Legion (http ://legion.virginia.edu), Condor (http ://www.cs.wisc.edu/condor), Unicore
(http ://www.unicore. org), Globus (http ://www.globus.org/toolkit) etc. Ces outils permettent la coordination des ressources qui ne sont pas sujet à un controle centralise en
utilisant des protocoles et interfaces generiques et standards et de delivrer une qualite de
service constante.
La combinaison de ces technologies de service web et grille de calcul sous lintitule
2
SOAP (Simple Object Access Protocol) est un protocole de transmission de messages. SOAP nest
ni lie à un système dexploitation ni à un langage de programmation. En tant que tel, il sagit dun
important composant de base pour developper des applications distribuees
3
WSDL est le langage de description des services Web (Web Services Description Language). Un fichier
WSDL est un document XML decrivant un ensemble de messages SOAP et la manière dont les messages
sont echanges
4
UDDI (Universal Discovery Description and Integration) est lequivalent des pages jaunes dans les
services Web. Une entree du repertoire UDDI est constituee dun fichier XML qui decrit une entreprise
et les services quelle offre.
116
de grille pervasive suscite de plus en plus dinteret en telemedecine [144]. La figure 4.5
illustre bien lutilite dune strategie de deploiement faisant appel à de telles technologies
dans le cadre de notre application.
Fig. 4.5 Grille pervasive au service de la telemedecine. Inspire de David De Roure,

Mobile Medical Monitoring, National e-Science Centre Talk.
4.3.3
117
Sc
enario dutilisation du module de synth`
ese dECG
Moyennant la technologie des services web et linfrastructure de grille de calcul, la

tache dapprentissage des reseaux de neurones est deleguee à un service web. Ce dernier
sapproprie des ressources de calcul necessaires pour effectuer un apprentissage dun comite de reseaux de neurones specifiques et pour renvoyer les resultats au PEM. Le mode
de fonctionnement envisage est le suivant (Figure 4.6) :
Lors de la première utilisation du système et jusquà lacquisition dun ECG standard
de reference, lutilisateur enregistre un ECG 3D et lECG artificiel 12D correspondant serait synthetise à partir de lECG PEM en appliquant le comite de reseaux
de neurones generiques stocke initialement dans le PEM.
Le module de synthèse dECG est mis à jour par lajout dun dispositif de synthèse
dECG specifique à loccasion dune des visites du patient chez son cardiologue.
Cette mise à jour est conditionnee par lacquisition dun ECG standard 12D par le
cardiologue. Ce dernier accède via Internet à lun des serveurs dapplication dEPIMEDICS, envoie lECG du patient au serveur dapplication qui, à laide dun service
web, calcule et retourne un comite de reseaux de neurones specifique au patient. En
effet, à chaque nouvelle acquisition dECG standard 12D, le cardiologue devrait
envoyer ces nouveaux ECG au serveur dapplication pour etre stockes dans une
base de donnees propre au patient. Cette base de donnees servira ulterieurement à
mettre à jour à la fois les dispositifs de synthèse dECG specifique et generique.
En outre, meme si la synthèse specifique sest averee etre plus precise, la reconstruction par voie generique reste particulièrement attrayante dans les situations o`
u
le bruit ou des artefacts sont releves sur les signaux. En effet, alors que la reconstruction specifique peut devenir davantage influencee par ce phenomène et produire
des ECG de mauvaise qualite avec un risque dalterer le contenu diagnostique, la
reconstruction generique est moins vulnerable à cet effet puisquelle a ete obtenue
à partir dun grand ensemble dECG anonymes et variables intra et inter sujets.
Pour ces raisons, chaque fois que lutilisateur du PEM acquiert un nouvel ECG,
les deux dispositifs de synthèse specifique et generique sont employes pour produire
respectivement deux ECG de synthèse, lun generique et lautre specifique. Un module danalyse de la qualite du signal devrait etre concu pour determiner le meilleur
ECG synthetise suivant une serie de test : par exemple, comparaison par rapport à
lECG de reference acquis par le cardiologue, etc. Ceci aiderait à eviter les erreurs
de diagnostic dues à une mauvaise qualite dECG synthetises.
118
Fig. 4.6 Scenario dutilisation du module de synthèse dECG. Le cardiologue acquiert

un ECG standard 12D du patient, accède via Internet au serveur dapplication qui, à laide
dun service web, reserve les ressources necessaires, calcule et met à jour les dispositifs de
synthèse dECG par reseaux de neurones dans le PEM.
4.4
119
Conclusion
Dans ce chapitre, nous avons presente les aspects lies au deploiement et à la maintenance de la plateforme decisionnelle du PEM, en particulier le module neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes. Nous avons
egalement presente les strategies de deploiement du module de reconstruction de lECG
par comites de reseaux de neurones integrant des serveurs web applicatifs et des grilles de
calcul. La mise en application de ce module dans le cadre dun scenario global à grande
echelle de calcul dune matrice de synthèse specifique à chaque utilisateur du PEM serait
sans doute lune des principales perspectives de recherche future de nos travaux.
Quatri`
eme partie
Conclusion g
en
erale
120
Conclusion g
en
erale
Ce memoire constitue une presentation detaillee de mes travaux de recherche au cours
de 4 annees de thèse. Ces travaux, qui sinscrivent dans la continuite du projet europeen
EPI-MEDICS qui a pour objectif la realisation dun moniteur personnel dECG (PEM),
ont contribue à mettre en uvre les modules de diagnostic automatique de linfarctus et
la synthèse de lECG standard. Ces modules seront les fondements de la future plateforme
daide à la decision qui sera embarquee dans le PEM.
Trois domaines detude ont ete abordes dans cette thèse : le classement automatique,
la fusion de donnees, et lapproximation de signaux. Pour chacune de ces parties, nous
presentons ci-après un resume de notre contribution et quelques perspectives.
Interpr
etation automatique de lECG et fusion de
donn
ees
R
esum
e
Les travaux presentes dans la première partie du document (chapitre 2) interviennent
dans la realisation des divers modules de la plateforme intelligente daide à la decision
qui sera ulterieurement integree dans le PEM. Cette plateforme, basee sur lutilisation
de techniques dintelligence artificielle, combinera à la fois linterpretation de lECG du
patient et des donnees cliniques contenues dans son dossier medical personnel pour generer
un score de risque dinfarctus. Larchitecture fonctionnelle de la plateforme fut lobjet
dune presentation lors des Journees Sciences, Technologies et Imagerie pour la Medecine
à Nancy en Mars 2005 [145].
Le module dinterpretation des ECG enregistres par lutilisateur lui-meme etablit un
diagnostic dinfarctus du myocarde par le biais des reseaux de neurones qui ont montre
une performance de diagnostic elevee, comparable à celle des experts cardiologues. Cette
superiorite des reseaux de neurones, par rapport à des approches traditionnelles telles que
lanalyse discriminante, provient principalement de la combinaison de leurs resultats.
122
Le module de stratification des facteurs de risque par reseaux bayesiens permet destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur
les facteurs de risque propres au patient. La performance enregistree par lapproche des
reseaux bayesiens sest averee très prometteuse. Jai ete invite à presenter une communication orale sur les resultats du module bayesien lors du 6ème STAFF Studies Symposium
qui a ete organise par le Duke Medical Center de Durham à St Jean dArdières en septembre 2005. De meme, la presentation de la methode et des resultats viennent detre
acceptes pour publication à la conference internationale IEEE Computers in Cardiology
2006 [115].
Perspectives
Les perspectives devolution et damelioration des methodes presentees dans cette
partie, les reseaux de neurones et les reseaux bayesiens, sont très nombreuses pour diverses
raisons :
dune part liees au fait quil faudrait explorer de nouvelles approches doptimisation
des methodes actuelles. En effet, la marge de progression reste consequente :
au niveau du pretraitement des donnees (le choix de lACP pour les reseaux
de neurones. . . ),
et de loptimisation de lapprentissage neuronal via des techniques dapprentissage selective [96], evolutive [95], etc.
dautre part, lies au fait quil faudrait tester dautres techniques de prediction,
notamment pour le module de stratification des facteurs de risque. Les reseaux
bayesiens dynamiques devraient etre testes par rapport aux reseaux bayesiens statiques que nous avons utilises jusquà present. Mais cela est conditionne par le
fait davoir une base de donnees dynamique o`
u chaque patient dispose dun suivi
regulier avec enregistrement de tous les ECG, donnees cliniques, evolution diagnostique dans la base de donnees. En dautres termes, il faudrait avoir, pour le meme
patient, un historique medical complet et seriel afin de pouvoir etablir une stratification evolutive du risque cardiovasculaire. De meme, la construction (en cours)
dune base de donnees PEM (ECG PEM, ECG standards, donnees cliniques, etc.)
devrait permettre de tester differents scenarios dinteraction entre les classifieurs
grace à la mise en uvre dalgorithmes de logique floue pour maximiser la sensibilite dinterpretation du système tout en conservant une specificite elevee.
Enfin, la validation des diverses methodes et techniques developpees au cours de cette
thèse necessitent deffectuer des evaluations cliniques consequentes pour sassurer de la
qualite des algorithmes mis en place, evaluations qui sont de fait freinees par labsence
de bases de donnees dans ce domaine. Une première etape devaluation va etre effectuee
sur une serie de bases de donnees à laquelle nous avons recemment eu accès (BUSSELTON [146], MRACS [147]). Ulterieurement, les methodes et algorithmes developpes et
implementes dans le système vont faire lobjet dune experimentation pilote et dune
evaluation clinique en region Rhone-Alpes dans le cadre du projet SIPIRA (Système
Integre Pervasif Intelligent de suivi de patients cardiaques en region Rhones-Alpes), etc.
123
Synth`
ese de lECG par comit
es de r
eseaux de neurones
R
esum
e
Lautre apport de cette thèse est le developpement dune methode originale et performante permettant la synthèse de lECG standard 12 derivations à partir dun ECG
simplifie enregistre par le patient. Les evaluations effectuees sur une population detude
de 300 patients de la base de donnees de Lund ont montre une amelioration de plus de 15%
en qualite de signal par rapport aux methodes lineaires preconisees par la litterature. Les
resultats de cette experimentation ont ete presentes à la conference internationale IEEE
Computers in Cardiology en septembre 2004 [140]. La deuxième etape devaluation, diagnostique, sur la base de donnees de Lund est prevue pour publication. La troisième etape
devaluation sur la base de donnees CHDB (ECG PEM 3D et ECG standard 12D) a ete
soumise pour publication dans la revue internationale Methods of Information in Medicine [141]. Cette dernière phase devaluation de la methode de synthèse par reseaux de
neurones sur des ECG 12D seriels ou des ECG PEM enregistres dans des conditions simulant celles dutilisation du PEM (cest à dire en ambulatoire ou à domicile, acquisition
par le patient, son entourage ou une aide soignante, avec un positionnement delectrodes
different de celui de lECG standard 12D), a montre une performance largement superieure
à celle de la litterature.
Perspectives
Lapproche de reconstruction que jai developpee a prouve son efficacite. La prochaine
etape consistera à proceder au deploiement de la methode dans le PEM et à prevoir
linfrastructure necessaire pour realiser lapprentissage neuronal à grande echelle, à savoir
le recours aux technologies des services web et grilles de calcul.
Le mot de la fin
Lobjectif de cette thèse a ete de contribuer à la conception et la realisation dun moniteur personnel dECG (PEM) capable de detecter les dysfonctionnements cardiaques, de
gerer des alarmes et de transmettre les informations relatives à lutilisateur du système (citoyen/patient) aux services de sante concernes. Lensemble des travaux qui a ete presente
dans cette thèse est motive par la volonte de developper un outil efficace de prevention
qui pourrait reduire la mortalite et la morbidite liees à la survenue devenements cardiovasculaires en reduisant le temps separant lapparition des symptomes et le debut
des traitements. Nous esperons que cette etude servira à stimuler la recherche dans ce
domaine.
Bibliographie
[1] World health statistics 2006, World Health Organization, Tech. Rep., 2006.
[2] Recommendations of a Task Force of the European Society of Cardiology and the
European Resuscitation Council on The Pre-Hospital Management of Acute Heart
Attacks, Eur Heart J, vol. 19, pp. 114064, 1998.
[3] J. McMurray et al., CardiologyI : Treatment of myocardial infarction, unstable
angina, and angina pectoris, BMJ, vol. 309, no. 6965, pp. 134350, 1994.
[4] R. Luepker, Delay in acute myocardial infarction : why dont they come to the
hospital more quickly and what can we do to reduce delay ? Am Heart J, vol. 150,
no. 3, pp. 36870, 2005.
[5] A. McGinn, D. Goff, H. Taylor, et al., Trends in prehospital delay time and use
of emergency medical services for acute myocardial infarction : experience in 4 US
communities from 1987-2000, Am Heart J, vol. 150, no. 3, pp. 392400, 2005.
[6] P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al., New paradigms in telemedicine : ambient intelligence, wearable, pervasive and personalized, Stud Health
Technol Inform, vol. 108, pp. 12332, 2004.
[7] P. Rubel, J. Fayn, S. Arod, H. Atoui, D. Telisson, et al., Intelligence Ambiante et
Systèmes Pervasifs en Telemedecine. Exemples dApplications en Telecardiologie,
La Revue des SAMU, vol. 26, pp. 521526, 2004.
[8] Myocardial Infarction redefined - A concensus document of the joint European Society of Cardiology / American College of Cardiology Committee for the redefinition
of myocardial Infarction, Eur Heart J, vol. 21, pp. 15021513, 2000.
[9] S. Smith, S. Blair, R. Bonow, L. Brass, et al., AHA/ACC Guidelines for Preventing
Heart Attack and Death in Patients With Atherosclerotic Cardiovascular Disease :
2001 update. A statement for healthcare professionals from the American Heart
Association and the American College of Cardiology, J Am Coll Cardiol, vol. 38,
no. 5, pp. 15813, 2001.
[10] H. McGill, C. McMahan, E. Herderick, et al., Obesity accelerates the progression
of coronary atherosclerosis in young men, Circulation, vol. 105, no. 23, pp. 27128,
2002.
BIBLIOGRAPHIE
125
[11] L. Goldstein, R. Adams, M. Alberts, L. Appel, et al., Primary prevention of ischemic stroke : a guideline from the American Heart Association/American Stroke
Association Stroke Council, Circulation, vol. 113, no. 4, pp. 873923, 2006.
[12] J. Salonen, G. Alfthan, J. Huttunen, J. Pikkarainen, et al., Association between
Cardiovascular Death and Myocardial Infarction and Serum Selenium in a Matchedpair Longitudinal Study, Lancet, vol. 24, pp. 175179, July 1982.
[13] A. Kadish, A. Buxton, H. Kennedy, B. Knight, et al., ACC/AHA clinical competence statement on electrocardiography and ambulatory electrocardiography : A
report of the ACC/AHA/ACP-ASIM task force on clinical competence (ACC/AHA
committee to develop a clinical competence statement on electrocardiography and
ambulatory electrocardiography) endorsed by the International Society for Holter
and noninvasive electrocardiology, Circulation, vol. 104, no. 25, pp. 316978, 2001.
[14] J. Alpert, K. Thygesen, E. Antman, et al., Myocardial infarction redefineda
consensus document of The Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction, J Am
Coll Cardiol, vol. 36, no. 3, pp. 959969, 2000.
[15] B. McCarthy, J. Beshansky, et al., Missed diagnoses of acute myocardial infarction
in the emergency department : Results from a multicenter study, Ann Emerg Med,
vol. 22, pp. 579582, 1993.
[16] R. Puleo, D. Meyer, C. Wathen, C. Tawa, et al., Use of a rapid assay of subforms
of creatine kinase MB to diagnose or rule out acute myocardial infarction, N Engl
J Med, vol. 331, pp. 561566, 1994.
[17] R. Roberts et al., Earlier diagnosis and treatment of acute myocardial infarction
necessitates the need for a new diagnostic mind set, Circulation, vol. 89, pp.
872881, 1994.
[18] J. Pope, T. Aufderheide, R. Ruthazer, R. Woolard, et al., Missed diagnoses of acute
cardiac ischemia in the emergency department, N Engl J Med, vol. 342, no. 16, pp.
11631170, 2000.
[19] H. Koukkunen, K. Pyorala, et al., Low-risk patients with chest pain and without
evidence of myocardial infarction may be safely discharged from emergency department, Eur Heart Journal, vol. 25, pp. 329334, 2004.
[20] C. Swap et al., Value and Limitations of Chest Pain History in the Evaluation of
Patients With Suspected Acute Coronary Syndromes, JAMA, vol. 294, pp. 2623
2629, 2005.
[21] J. Willems, P. Arnaud, J. van Bemmel, R. Degani, et al., Common standards
for quantitative electrocardiography : goals and main results. CSE working party,
Methods Inf Med, vol. 29, no. 4, pp. 28997, 1990.
BIBLIOGRAPHIE
126
[22] M. Ohlson, H. Ohlin,

S. Wallerstedt, et al., Usefulness of Serial Electrocardiograms
for Diagnosis of Acute Myocardial Infarction, Am J Cardiol, vol. 88, no. 5, pp. 478
481, 2001.
[23] P. Rubel, J. Fayn, et al., State of the art of automated and serial ECG analysis,
Information Society Technologies Programme, Tech. Rep. D2.1, 2001.
[24] P. Arnaud, P. Rubel, D. Morlet, J. Fayn, et al., Methodology of ECG Interpretation
in the Lyon Program, Methods Inf Med, vol. 24, no. 4, pp. 393402, 1990.
[25] J. Willems, C. Abreu-Lima, P. Arnaud, et al., The diagnostic performance of computer programs for the interpretation of electrocardiograms, N Engl J Med, vol.
325, no. 25, pp. 176773, 1991.
[26] J. Fayn et al., Caviar, a Serial ECG Processing System for the Comparative Analysis of VCGs and their Interpretation with Auto-reference to the Patient, J Electrocardiol, no. 21, pp. 173176, 1988.
[27] J. Fayn, Lanalyse sequentielle des electrocardiogrammes. une approche par comparaison optimale dimages filaires spatio-temporelles, Ph.D. dissertation, INSA de
Lyon, 1990.
[28] P. Macfarlane, Computer Processing of the 12-Lead ECG, Cardiac Electrophysiology Review, vol. 1, no. 3, pp. 296301, 1997.
[29] L. Dowdy, G. Wagner, Y. Birnbaum, P. Clemmensen, et al., Early repolarization :
friend or foe ? Am J Med, vol. 115, no. 3, pp. 23740, 2003.
[30] J. Healy, Editorial of the special health and the Internet for all, Int J Med Inform,
vol. 75, no. 1, 2006.
[31] A. Bynum, C. Cranford, C. Irwin, et al., Effect of telemedicine on patients diagnosis and treatment, J Telemed Telecare, vol. 12, no. 1, pp. 3943, 2006.
[32] J. Fayn, C. Ghedira, D. Telisson, et al., Towards New Integrated Information and
Communication Infrastructures in eHealth. Examples from Cardiology, in IEEE
Computers in Cardiology, A. Murray, Ed., vol. 30, 2003, pp. 11316.
[33] C. Massone, H. Soyer, R. Hofmann-Wellenhof, et al., Two years experience with
Web-based teleconsulting in dermatology, J Telemed Telecare, vol. 12, no. 2, pp.
837, 2006.
[34] J. Ameen, A. Coll, et al., Impact of tele-advice on community nurses knowledge
of venous leg ulcer care, J Adv Nurs, vol. 50, no. 6, pp. 58394, 2005.
[35] J. Fayn, F. Petitjean, et al., Macro-data : a new approach for the development of
tele-expertise applications, in IEEE Computers in Cardiology, vol. 26, 1999, pp.
414.
BIBLIOGRAPHIE
127
[36] V. Rialle, N. Noury, et al., An experimental health smart home and its distributed
internet-based information and communication system : first steps of a research
project, in Medinfo, vol. 10, no. 2, 2001, pp. 147983.
[37] J. Thomesse, D. Belot, A. Boyer, et al., Integrated information technologies for
patients remote follow up and homecare, in HealthCom, 2001, pp. 315.
[38] P. Rubel, J. Willems, C. Zywietz, J. Fayn, et al., Health in the New Communications
Age. IOS Press, 1995, vol. 24, ch. OEDIPE. Open European Data Interchange and
Processing for Electrocardiography, pp. 313321.
[39] Health in the New Communications Age. IOS Press, Amsterdam, 1995, vol. 24.
[40] J. van Bemmel, A. van Ginneken, H. Stam, et al., Integration and communication
for the continuity of cardiac care (i4c), J Electrocardiol, vol. 31, pp. 608, 1998.
[41] J. van Bemmel, Handbook of Medical Informatics. Springer, New York, 2002.
[42] P. Rubel et al., Protocole de communications standard pour lelectrocardiographie
quantitative, Informatique et Sante, vol. 4, pp. 4555, 1991.
[43] Medical informatics standard communication protocol-computer-assisted electrocardiography (SCP-ECG), ENV, Tech. Rep. 1064, 1993.
[44] J. Willems, P. Rubel, et al., Standard interchange for computerized electrocardiography, Stud Health Technol Inform, vol. 6, pp. 18594, 1993.
[45] P. Rubel, J. Willems, et al., Development of a conceptual reference model for digital
ECG data storage, in IEEE Computers in Cardiology, vol. 18, 1991, pp. 10912.
[46] P. Rubel, J. Willems, C. Zywietz, et al., Towards open data interchange and processing of serial ECGs, in IEEE Computers in Cardiology, vol. 19, 1992, pp. 7982.
[47] P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, et al., Toward personal eHealth in
cardiology. Results from the EPI-MEDICS telemedicine project, J Electrocardiol,
vol. 38, pp. 100106, 2005.
[48] E. Harold et al., XML in a Nutshell, Third Edition. OReilly Media, Paris, 2004.
[49] E. Berner, Clinical Decision Support Systems : Theory and Practice. Springer, NY,
1998.
[50] J. Haton, N. Bouzid, F. Charpillet, et al., Le raisonnement en intelligence artificielle.
InterEditions, Paris, 1991.
[51] A. Jain, R. Duin, et al., Statistical Pattern Recognition : a review, IEEE Trans
Pattern Anal Mach Intell, vol. 22, pp. 437, 2000.
[52] C. Bishop, Neural Networks for Pattern Recognition.
Oxford, 1996.
Oxford University Press,
BIBLIOGRAPHIE
128
[53] B. Kirkwood et al., Essential Medical Statistics. Blackwell Science, UK, 2003.
[54] G. McLachlan, Discriminant Analysis and Statistical Pattern Recognition.
Interscience, Canada, 2004.
Wiley
[55] H. Bengtsson, Bayesian Networks : a Self-contained Introduction with Implementation Remarks, Mathematical Statistics, Lund Institute of Technology, Tech. Rep.,
1999.
[56] G. Luger, Artificial Intelligence : Structures and Strategies for Complex Problem
Solving. Addison Wesley, 2004.
[57] A. Sharkey et al., Diversity, Selection and Ensembles of Artificial Neural Nets,
in Proceedings of Third International Conference on Neural Networks and their
Applications, Marseille, France, March 1997, pp. 205212.
[58] J. Bailey, A. Berson, H. Handelsman, et al., Utility of Current Risk Stratification
Tests for Predicting Major Arrhythmic Events After Myocardial Infarction, JACC,
vol. 38, no. 7, pp. 190211, 2001.
[59] A. D. Timmis, Early diagnosis of acute myocardial infarction, BMJ, vol. 301, pp.
941942, 1990.
[60] A. Timmis, Will serum enzymes and other proteins find a clinical application in
the early diagnosis of myocardial infarction ? Br Heart J, vol. 71, pp. 309310,
1994.
[61] H. Lee, S. Cross, P. Garthwaite, A. Dickie, I. Ross, et al., Comparison of the value
of novel rapid measurement of myoglobin, creatine kinase, and creatine kinase-MB
with the electrocardiogram for the diagnosis of acute myocardial infarction, Br
Heart J, vol. 71, pp. 311315, 1994.
[62] J. Mair, J. Smidt, P. Lechleitner, F. Dienstl, et al., A decision tree for the early
diagnosis of acute myocardial infarction in nontraumatic chest pain patients at
hospital admission, Chest, vol. 108, pp. 15021509, 1995.
[63] L. Jeanpierre et al., Automated medical diagnosis with fuzzy stochastic models :
monitoring chronic diseases, Acta Biotheor, vol. 52, no. 4, pp. 291311, 2004.
[64] D. Bellot, Fusion de donnees avec des reseaux bayesiens pour la modelisation des
systèmes dynamiques et son application en telemedecine, Ph.D. dissertation, Universite Nancy1, 2002.
[65] P. Lisboa, Artificial neural networks in biomedicine. Springer-Verlag, London, 2000.
[66] W. Baxt, Use of an artificial neural network for the diagnosis of myocardial infarction, Ann Intern Med, vol. 115, no. 11, pp. 843848, 1991.
BIBLIOGRAPHIE
129
[67] R. Harrison, S. Marshall, et al., The early diagnosis of heart attacks : a neurocomputational approach, in International Joint Conference on Neural Networks,
vol. 1, 1991, pp. 15.
[68] R. Kennedy, R. Harrison, A. Burtonc, et al., An artificial neural network system
for diagnosis of acute myocardial infarction (AMI) in the accident and emergency
department : evaluation and comparison with serum myoglobin measurements,
Comput Methods Programs Biomed, vol. 52, pp. 93103, 1997.
[69] W. Baxt, F. Shofer, F. Sites, et al., A neural computational aid to the automated
diagnosis of acute myocardial infarction, Ann Emerg Med, vol. 34, pp. 366373,
2002.
[70] B. Heden, H. Ohlin,

R. Rittner, et al., Acute myocardial infarction detected in the
12-lead ECG by artificial neural networks, Circulation, vol. 96, no. 6, pp. 1798
1802, 1997.
[71] K. Gurney, An Introduction to Neural Networks. 1st ed. UCL Press, London, 1997.
[72] F. Rosenblatt, Principles of Neurodynamics.
1961.
[73] L. Fausett, Fundamentals of Neural Networks.
NJ, 1994.
Spartan Press, Washington D.C.,

Prentice Hall, Englewood Cliffs,
[74] T. Kohonen, Self-Organizing Maps. Springer, Berlin, 1995.

[75] J. Hopfield, Neural networks and physical systems with emergent collective computational abilities, in National Academy of Sciences, vol. 79, 1982, pp. 25542558.
[76] D. Rumelhart, G. Hinton, et al., Learning internal representations by error propagation, in Parallel Data Processing, vol. 1. The M.I.T. Press, Cambridge, MA,
1986, pp. 318362.
[77] L. Hansen et al., Neural network ensembles, IEEE Trans Pattern Anal Mach
Intell, vol. 12, pp. 9931001, 1990.
[78] A. Krogh et al., Neural network ensembles, cross validation, and active learning,
in Adv Neural Inf Process Syst, G. Tesauro, D. Touretzky, et al., Eds., vol. 2, 1995,
pp. 650659.
[79] D. Opitz et al., Popular ensemble methods : An empirical study, Journal of Artificial Intelligence Research, vol. 11, pp. 169198, 1999.
[80] A. Sharkey, On combining artificial neural nets, Connection Science, vol. 8, pp.
299314, 1996.
[81] L. Breiman, Bagging predictors, Machine Learning, vol. 24, no. 2, pp. 123140,
1996.
BIBLIOGRAPHIE
130
[82] Y. Freund et al., Experiments with a new boosting algorithm, in International

Conference on Machine Learning, 1996, pp. 148156.
[83] Y. Liu, X. Yao, et al., Evolutionary ensembles with negative correlation learning,
IEEE Transactions on Evolutionary Computation, vol. 4, no. 3, pp. 295304, 2000.
[84] B. Rosen, Ensemble learning using decorrelated neural networks, Connection
Science, vol. 8, pp. 373384, 1996.
[85] A. Sharkey, Combining Artificial Neural Nets : Ensemble and Modular Multi-Net
Systems, in Multi-Net Systems. Springer-Verlag, 1999, pp. 130.
[86] C. Papaloukas, D. Fotiadis, A. Likas, et al., An ischemia detection method based
on artificial neural networks, Artif Intell Med, vol. 24, pp. 167178, 2002.
[87] D. Marquardt, An algorithm for least-squares estimation of nonlinear parameters,
Journal of the Society for Industrial and Applied Mathematics, vol. 11, no. 2, pp.
431441, 1963.
[88] P. Gill, W. Murray, et al., The Levenberg-Marquardt Method, in Practical Optimization. Academic Press, 1981, pp. 136137.
[89] A. Jerebko, R. Summers, J. Malley, M. Franaszek, et al., Computer-assisted detection of colonic polyps with CT colonography using neural networks and binary
classification trees, Med Phys, vol. 30, no. 1, pp. 5260, 2003.
[90] A. Jerebko, J. Malley, M. Franaszek, et al., Multiple Neural Network Classification
Scheme for Detection of Colonic Polyps in CT Colonography Data Sets, Acad
Radiol, vol. 10, pp. 154160, 2003.
[91] J. Ellenius, T. Groth, B. Lindahl, et al., Early assessment of patients with suspected acute myocardial infarction by biochemical monitoring and neural network
analysis, Clin Chem, vol. 43, no. 10, pp. 191925, 1997.
[92] P. Warrick, E. Hamilton, et al., Neural Network Based Detection of Fetal Heart
Rate Patterns, in IEEE International Joint Conference on Neural Networks
(IJCNN), vol. 4, 2005, pp. 24002405.
[93] D. Bates et al., Improving safety with information technology, N Engl J Med, vol.
348, no. 25, pp. 252634, 2003.
[94] E. Vonk, L. Jain, et al., Automatic Generation of Neural Network Architecture Using
Evolutionary Computation. World Scientific Publishing Co., Singapore, 1997.
[95] H. Haraldsson et al., A New Learning Scheme for Neural Network Ensembles,
2004, submitted to IEEE Trans Neural Netw.
[96] Z. Zhou, J. Wu, W. Tang, et al., Selectively Ensembling Neural Classifiers, in
International Joint Conference on Neural Networks, vol. 2, 2002, pp. 14111415.
BIBLIOGRAPHIE
131
[97] G. Diamond et al., Analysis of probability as an aid in the clinical diagnosis of

coronary-artery disease, N Engl J Med, vol. 300, pp. 13501358, 1979.
[98] P. Szolovits, Uncertainty and decisions in medical informatics, Methods Inf Med,
vol. 34, pp. 11121, 1995.
[99] C. Kahn, Artificial intelligence in radiology : decision support systems, Radiographics, vol. 14, pp. 849861, 1994.
[100] C. Lagor, D. Aronsky, M. Fiszman, et al., Automatic identification of patients eligible for a pneumonia guideline : comparing the diagnostic accuracy of two decision
support models. in Medinfo, vol. 10, no. 1, 2001, pp. 4937.
[101] D. Luciani, M. Marchesi, et al., The role of Bayesian Networks in the diagnosis of
pulmonary embolism, J Thromb Haemost, vol. 1, no. 4, pp. 698707, 2003.
[102] C. Twardy, A. Nicholson, K. Korb, et al., Data mining cardiovascular Bayesian
networks, Health Data Mining Workshop, Univ. of South Australia, 2005.
[103] F. Gueyffier, F. Boutitie, J. Boissel, et al., INDANA : a meta-analysis on individual
patient data in hypertension. Protocol and preliminary results, Therapie, vol. 50,
no. 4, pp. 353362, 1995.
[104] T. Stephenson, An Introduction to Bayesian Network Theory and Usage, IDIAP,
Research Report 00-03, 2000.
[105] F. Jensen et al., Optimal Junction Trees, in Proceedings of the 10th Conference
on Uncertainty in Artificial Intelligence, July 1994.
[106] F. Jensen, An Introduction to Bayesian Networks. UCL Press Ltd, London, 1996.
[107] C. Huang et al., Inference in Belief Networks : A Procedural Guide, International
Journal of Approximate Reasoning, vol. 15, pp. 225263, 1996.
[108] J. Bilmes, A Gentle Tutorial of the E.M. Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models, International
Computer Science Institute, Berkeley California, Tech. Rep., 1998.
[109] A. Dempster, N. Laird, et al., Maximum Likelihood from Incomplete Data via the
E.M. Algorithm, J R Stat Soc, vol. Ser.B 39, no. 1, pp. 138, 1977.
[110] I. Colombet, A. Ruelland, G. Chatellier, et al., Models to Predict Cardiovascular
Risk : Comparison of CART, Multilayer Perceptron and Logistic Regression, in
AMIA Symposium, 2000, pp. 156160.
[111] B. Wielinga, G. Schreiber, et al., KADS : a modelling approach to knowledge
engineering. In Knowledge Acquisition, Knowledge Acquisition, vol. 4, pp. 136
145, 1992.
[112] C. Vogel, Genie Cognitif. Masson, Paris, 1988.
BIBLIOGRAPHIE
132
[113] J. Quinlan, P. Compton, et al., Inductive knowledge acquisition : A case study.

Turing Institute Press, Glascow, 1987.
[114] J. Ganascia, EKAW 90 Tutorial Notes : Machine Learning, in Proceedings of the
3rd European Workshop on Knowledge Acquisition for Knowledge-Based Systems
(EKAW 89), 1989, pp. 287296.
[115] H. Atoui, J. Fayn, F. Gueyffier, et al., Cardiovascular Risk Stratification in Decision Support Systems, A Probabilistic Approach. Application to pHealth, 2006,
accepted for publication in IEEE Computers in Cardiology.
[116] L. Zadeh, Fuzzy logic, neural networks, and soft computing, Communications of
the ACM, vol. 37, pp. 7783, 1994.
[117] B. Bouchon-Meunier, La logique floue. Presses Universitaires France, 1994.
[118] F. Chevrie et al., La logique floue, Institut Schneider Formation, Cahier Technique Schneider n 191, 1998.
[119] S. Nelwan, Evaluation of 12-Lead ECG Reconstruction Methods for Patient Monitoring, Ph.D. dissertation, Erasmus Universiteit Rotterdam, 2005.
[120] J. Scherer, J. Jenkins, et al., Synthesis of the 12-lead electrocardiogram from a 3lead subset using patient-specific transformation vectors. An algorithmic approach
to computerized signal synthesis, J Electrocardiol, vol. 22, pp. 128136, 1989.
[121] S. Nelwan, J. Kors, S. Meij, et al., Reconstruction of the 12-Lead ECG using Reduced
Lead Sets for Patient Monitoring. Leiden : Einthoven Foundation, 2002, pp. 545
551.
[122] R. Modre, M. Seger, G. Fischer, et al., Cardiac anisotropy : is it negligible regarding
noninvasive activation time imaging ? IEEE Trans Biomed Eng, vol. 53, no. 4, pp.
569580, 2006.
[123] R. Gulrajani, The forward and inverse problems of electrocardiography, IEEE
Eng Med Biol Mag, vol. 17, no. 5, pp. 84101, 1998.
[124] J. Scherer et al., Evaluation of 12-Lead ECG Synthesis using Analysis Measurments
in 240 Patients, in IEEE Computers in Cardiology, 1992, pp. 914.
[125] S. Adami, D. Assanelli, F. Comba, J. Fayn, R. Gatta, et al., EPI-MEDICS System
Specification and Design, Information Society Technologies Programme, Tech. Rep.
D3.1, 2001.
[126] S. Adami, J. Fayn, F. Gouaux, M. Ohlson, L. Simon-Chautemps, et al., EPIMEDICS System Revisions, Information Society Technologies Programme, Tech.
Rep. D7.1, 2003.
BIBLIOGRAPHIE
133
[127] J. Scherer et al., Synthesis of the 12-Lead Electrocardiogram from a 3-Lead Semiorthogonal Subset using Patient-specific Transformation Arrays, in IEEE Computers in Cardiology, 1988, pp. 149151.
[128] S. Nelwan, J. Kors, S. Meij, J. van Bemmel, et al., Reconstruction of the 12-lead
electrocardiogram from reduced lead sets, J Electrocardiol, vol. 37, no. 1, pp. 1118,
2004.
[129] R. Duin, Learned from Neural Networks, in ASCI 2000, Sixth Annual Conference
of the Advanced School for Computing and Imaging, 2000, pp. 913.
[130] S. Mitra, S. Pal, et al., Data Mining in Soft Computing Framework : A Survey,
IEEE Trans Neural Netw, vol. 13, no. 1, pp. 314, 2001.
[131] K. Hornik, M. Stinchcombe, et al., Multilayer feedforward networks are universal
approximators, Neural Netw, vol. 2, no. 359-366, 1989.
[132] K. Funahashi, On the Approximate Realization of Continuous Mappings by Neural
Networks, Neural Netw, vol. 2, pp. 183192, 1989.
[133] J. Castro, C. Mantas, et al., Neural networks with a continuous squashing function
in the output are universal approximators, Neural Netw, vol. 13, no. 6, pp. 5613,
2000.
[134] P. Macfarlane, Age, sex, and the ST amplitude in health and disease, J Electrocardiol, vol. 34, pp. 23541, 2001.
[135] M. Krucoff, Electrocardiographic monitoring and coronary occlusion. Fingerprint
pattern analysis in dimensions of space, time, and mind, J Electrocardiol, vol. 22,
pp. 2327, 1989.
[136] G. Nollo, P. Rubel, J. Fayn, D. Assanelli, M. Crotti, et al., PEM device and
EPI-MEDICS telemedical architecture final assessment report, Information Society
Technologies Programme, Tech. Rep. D6.1, 2004.
[137] The CSE Party : Recommendations for measurement standards in quantitative
electrocardiography, Eur Heart J, vol. 6, pp. 815825, 1985.
[138] M. Moller, A scaled conjugate gradient algorithm for fast supervised learning,
Neural Netw, vol. 6, pp. 525533, 1993.
[139] S. Orfanidis, Optimum Signal Processing. An Introduction. 2nd Edition. PrenticeHall, Englewood Cliffs, NJ, 1996.
[140] H. Atoui, J. Fayn, et al., A Neural Network Approach for Patient-Specific 12Lead ECG Synthesis in Patient Monitoring Environments, in IEEE Computers in
Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 161164.
BIBLIOGRAPHIE
134
[141] H. Atoui et al., A Novel Neural Network Model for Deriving Standard 12-lead ECGs
from serial 3-lead ECGs. Application to Self Care, 2006, submitted to Methods Inf
Med.
[142] D. Telisson, J. Fayn, et al., Design of a Tele-Expertise Architecture Adapted to
Pervasive Multi-Actor Environments. Application to eCardiology, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 749752.
[143] L. Simon-Chautemps, S. Arod, S. Adami, J. Fayn, C. Malossi, et al., Final Prototype, Information Society Technologies Programme, Tech. Rep. D7.2, 2004.
[144] P. Gouvas, G. Magiorkinis, A. Bouras, D. Paraskevis, et al., Web Service-Enabled
Grid-Based Platform for Drug Resistance Management, in Panhellenic Conference
on Informatics, vol. 3746, 2005, pp. 469479.
[145] H. Atoui, D. Telisson, et al., Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide à la decision par reseaux de
neurones du projet europeen EPI-MEDICS. in Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005, pp. 1314.
[146] M. Knuiman, H. Vu, et al., Multivariate risk estimation for coronary heart disease :
the Busselton health study, New Zealand Journal of Public Health, vol. 22, pp. 747
753, 1998.
[147] The MRACS study. URL http ://www.rcbweb.co.uk.
Cinqui`
eme partie
Annexes
135
Annexe A
Dossier M
edical Personnel embarqu
e
dans le PEM
A.1
Contenu du dossier de sant

e du patient
Ce dossier sera enregistre dans la Data Card du PEM (PEM Card) et sera consultable/modifiable au moyen dun navigateur Internet standard (connexion par RS232C ou
Bluetooth à un PC, un MAC ou un Palmtop). Par defaut, une donnee non renseignee sera
marquee Non Renseignee (NR). Lorsque lon remplit le dossier, et que lon ne sait pas
renseigner la donnee, on pourra utiliser le terme : inconnu (I). Des exemples ditems
pour lequel on pourra utiliser le terme inconnu sont : le sexe, le diabète, la localisation
des stenoses, etc.
A.2
Donn
ees d
emographiques
Cette section ne contient que les donnees utiles au professionnel de sante lorsquil
entreprend de visualiser et/ou de mettre à jour le dossier de sante du patient. Les donnees
demographiques complètes (avec adresse, numeros de telephone, description des contacts
etc.) sont indiquees dans la section contacts.
Nom
Prenom
Date de naissance : JJ/MM/AAA ou Age (ans)
Poids (Kg)
Taille (cm)
Sexe : (M, F, I)
Annexe A. Dossier Medical Personnel embarque dans le PEM
A.3
137
R
esultats danalyses biologiques
Cholesterol total (mg/dl)

Cholesterol HDL (mg/dl)
Cholesterol LDL (mg/dl)
Fibrinogènes (mg/dl)
Triglycerides (mg/dl)
Glycemie (mg /dl)
Nbre de leucocytes (109 /l)
Creatinemie (mol/l)
Enzymes hepatiques ALAT (SGPT) (U/l)
Enzymes hepatiques ASAT (SGOT) (U/l)
Hormone thyrodienne T3 (g/dl)
Hormone thyrodienne T4 (Thyroxine) (g/dl)
Hormone thyrodienne TSH (Thyroid-Stimulating Hormone) (mili U/l)
Proteines C-reactives (mg/dl)
A.4
A.4.1
El
ements du dossier cardiologique
Donn
ees cliniques
Tension arterielle systolique (mm Hg)

Tension arterielle diastolique (mm Hg)
Frequence cardiaque au repos (battements/mn)
Anemie : (O/N)
Diabète : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))
Douleurs thoraciques : (Non, Angine de poitrine typique, Angine de poitrine atypique, autre)
Dyspnee(s) : (Non, au repos, à leffort, au repos et à leffort)
Sujet à des Syncope(s) : (O/N)
Sujet à des Vertiges : (Non, au repos, à leffort, au repos et à leffort)
A.4.2
Interpr
etation de lECG au repos
Cette interpretation concerne exclusivement linterpretation de synthèse qui figurera

dans le dossier clinique du patient. Les interpretations des ECG enregistres par le patient
seront archivees dans la rubrique Rapport dinterpretation des PEM ECG
138
Interpretation de lECG standard à 12D : (Normal, probablement normal/non strictement normal, Anormal)
Troubles de la conduction : (O/N)
Instabilite electrique : (O/N)
Alteration(s) mineure(s) de lECG : (O/N)
A.4.3
R
esultats des tests de lECG deffort
Ischemie à leffort : (O/N)

Hypotension durant leffort : (O/N)
A.4.4
Diagnostic cardiologique
Hypertension arterielle : (O/N)

Hypertrophie ventriculaire : (Non, gauche, droite, bi-ventriculaire)
Tachycardie ventriculaire : (Non, Intermittente/Non-soutenue, Soutenue)
Bloc auriculo-ventriculaire : (Non, 2ème degre (Mobitz type II), 3ème degre, autre)
Autre(s) type(s) darythmie(s) : (O/N)
Si oui, et si vous estimez que cest important pour le suivi du patient, precisez le
type darythmie dans lhistorique clinique du patient.
Stenose aortique : ( Non, I, LAD, LCX, RCA, autre)
Infarctus ancien : (Non, I, Anterieur ou Antero-Lateral, Inferieur ou PosteroInferieur, Mixte)
Ischemie residuelle : (O/N)
Dysfonctionnement du ventricule gauche : (O/N)
Insuffisance cardiaque : (Non, moderee, sevère)
Fraction dejection (%) :
Cardiopathies arythmogènes congenitales ou acquises : (Non, QT long, Brugada,
WPW, ARVD, autre)
Cardiopathie valvulaire : (Non, prolapsus de valve mitrale, autre)
Cardiomyopathie du ventricule gauche : (Non, I, dilatee, hypertrophique, infiltrative,
autre)
Cardiomyopathie du ventricule droit : (O/N)
Autre type de cardiopathie congenitale : (O/N)
Maladie des coronaires dorigine anormale : (O/N)
Autre cardiopathie : (0/N)
type de cardiopathie dans lhistorique clinique du patient.
A.4.5
139
Proc
edures et traitements
Therapie interventionnelle : (Non, angioplastie, pontage coronarien, autre)

Traitement anti-cholesterol : (Non, statines, autres)
Traitement anti-hypertenseur : (O/N)
Autre(s) traitement(s) en cours : (O/N)
type de traitement dans lhistorique clinique du patient.
A.5
Facteurs de risque cardiovasculaire
A.5.1
Classe de Sant
e
Indiquez ci-après la categorie qui decrit le mieux possible letat general de sante du
patient. Ce classement sera utilise pour moduler lestimation du facteur de risque du sujet.
Categorie de sante : I, 1, 2, 3, 4, 5
Avec :
1. Sportif de niveau professionnel
2. Sujet normal
3. Suspicion dischemie et/ou de troubles du rythme
4. Ischemie et/ou troubles du rythme averes
5. Pathologie cardiaque documentee
A.5.2
Facteurs de risque majeurs
Sexe : (M, F, I)
Age :
Tabagie : (Non fumeur, Ex-Fumeur, Fumeur)
Obesite : (O/N)
Diabète : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))
Hypertension arterielle : (O/N)
Frequence cardiaque au repos (battements/mn) :
Cholesterol total (mg/dl) :
Fibrinogènes (mg/dl) :

Nbre de leucocytes (109/l) :
Claudication intermittente : (O/N)
A.5.3
Autres facteurs de risque
Tension arterielle systolique (mm Hg) :

Tension arterielle diastolique (mm Hg) :
Anemie : (O/N)
Maladie des coronaires dorigine anormale : (O/N)
Antecedents familiaux de maladie des coronaires : (O/N)
Antecedents familiaux de mort subite : (O/N)
140
Annexe B
La base de donn
ees INDANA
La base de donnees INDANA (INdividual Data ANalysis of Antihypertensive drug
interventions) reunit les donnees individuelles de 10 essais therapeutiques (controles randomises) conduits pour evaluer lefficacite de traitements anti-hypertenseurs [103].
Les sujets faisant partie de cette base de donnees ont ete suivis, en moyenne, sur une
periode de 5 ans et toute incidence devenements de nature cardiovasculaire a ete releve :
accident vasculaire cerebral, infarctus du myocarde, decès par accident vasculaire cerebral,
decès par infarctus du myocarde.
Cette base de donnees a ete mise en forme et est maintenue par lUnite de Pharmacologie Clinique de lUniversite Lyon 1 (chef de projet : Francois Gueyffier).
Annexe B. La base de donnees INDANA
142
Tab. B.1 Tableau descriptif des variables et labels de la base de donnees INDANA
Nom
SEX
AGE
BL HEIGH
BL WEIGH
BL BLO U
BL NBCIG
BL HR
BL SBP
BL DBP
BL ECGM1
Label
sexe
age
taille en debut detude
poids en debut detude
hematurie en debut detude
nombre de cigarettes en debut detude
frequence cardiaque en debut detude
pression arterielle systolique en debut detude
pression arterielle diastolique en debut detude
Q/QS Pattern
BL ECGM3
BL ECGM4
BL ECGM5
BL AF
BL GLUC
BL URIC
BL CHOL
BL CREAT
BL GLY U
BL PRT U
BL K
BL SMOKE
BL CATSM
BL UREA
BL BMI
HX DIAB
HX TTHBP
HX HBP
HX ANGIN
HX MI
HX ST
HX CLAUD
ST
MI
DEATH
DEATHMI
DEATHST
DEATHCV
Hypertrophie ventriculaire gauche /ECG

depression du segment ST
inversion de londe T
fibrillation atriale en debut detude
glycemie à jeun en debut detude
uricemie en debut detude
cholesterol total en debut detude
creatinemie en debut detude
glycosurie
proteinurie
kaliemie
tabagisme en debut detude
tabagisme en debut detude
uree sanguine en debut detude
index ponderal en debut detude
antecedent de diabète
antecedent de traitement antihypertenseur
antecedent dhypertension
antecedent dangor
antecedent dinfarctus myocardique
antecedent dAVC
antecedent de claudication
AVC (accident vasculaire cerebral)
IDM (infarctus du myocarde)
decès
decès par IDM
decès par AVC
decès cardio-vasculaire
Valeur
0 : femme, 1 : homme
en annees
en cm
en kg
nbre/jour
batt/mn
mmHg
mmHg
( 0 : pas danomalie,
1 anomalie la
moins significative,
2,...x anomalie
la plus significative)
0 : non ; 1 : oui
mmol/l
mmol/l
mmol/l
mmol/l
0 : non 1 :oui
0 : non 1 :oui
mmol/l
0 : non ; 1 :oui
4 categories
mmol/l
kg/m2
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
Annexe C
Architecture des r
eseaux de
neurones utilis
es pour la synth`
ese de
lECG
La meilleure configuration en termes darchitecture des reseaux de neurones utilises
pour la synthèse de lECG standard est determinee experimentalement en effectuant lapprentissage de hnt structures obtenues en faisant varier le nombre de couches cachees
(h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction dactivation (t=lineaire (purelin), sigmode : tangente sigmode (tansig), logarithme-sigmode
(logsig)). Les resultats detailles des performances des hnt structures en termes derreur RMS sur les 100 ECG de la population detude DS1 sont presentes dans les tableaux
ci-après.
Nb de couches cachees
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Nb de neurones par couche cache Fonctions dactivation

3
tansig
5
tansig
8
tansig
10
tansig
15
tansig
3
logsig
5
logsig
8
logsig
10
logsig
15
logsig
3
purelin
5
purelin
8
purelin
10
purelin
15
purelin
RMS
107.98
94.72
89.87
89.44
87.47
115.52
104.08
96.95
96.27
91.40
100.14
95.26
90.87
90.82
89.63
Annexe C. Architecture des reseaux de neurones utilises pour la synthèse de lECG 144
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

33
purelin tansig
35
purelin tansig
38
purelin tansig
3 10
purelin tansig
3 15
purelin tansig
53
purelin tansig
55
purelin tansig
58
purelin tansig
5 10
purelin tansig
5 15
purelin tansig
83
purelin tansig
85
purelin tansig
88
purelin tansig
8 10
purelin tansig
8 15
purelin tansig
10 3
purelin tansig
10 5
purelin tansig
10 8
purelin tansig
10 10
purelin tansig
10 15
purelin tansig
15 3
purelin tansig
15 5
purelin tansig
15 8
purelin tansig
15 10
purelin tansig
15 15
purelin tansig
33
purelin logsig
35
purelin logsig
38
purelin logsig
3 10
purelin logsig
3 15
purelin logsig
53
purelin logsig
55
purelin logsig
58
purelin logsig
5 10
purelin logsig
5 15
purelin logsig
83
purelin logsig
85
purelin logsig
88
purelin logsig
8 10
purelin logsig
8 15
purelin logsig
10 3
purelin logsig
10 5
purelin logsig
10 8
purelin logsig
10 10
purelin logsig
10 15
purelin logsig
15 3
purelin logsig
15 5
purelin logsig
15 8
purelin logsig
15 10
purelin logsig
15 15
purelin logsig
RMS
117.78
110.47
103.46
101.42
100.84
114.30
103.32
99.24
97.08
94.485
113.30
104.99
96.62
96.03
91.26
113.33
102.28
97.10
95.60
92.09
112.58
101.45
97.96
95.56
90.12
121.66
115.30
110.08
108.10
105.99
119.17
111.17
107.33
104.65
100.16
117.73
112.15
104.04
104.35
97.04
118.9
109.96
104.86
102.33
99.02
117.48
108.28
105.56
103.82
97.31
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

33
purelin purelin
35
purelin purelin
38
purelin purelin
3 10
purelin purelin
3 15
purelin purelin
53
purelin purelin
55
purelin purelin
58
purelin purelin
5 10
purelin purelin
5 15
purelin purelin
83
purelin purelin
85
purelin purelin
88
purelin purelin
8 10
purelin purelin
8 15
purelin purelin
10 3
purelin purelin
10 5
purelin purelin
10 8
purelin purelin
10 10
purelin purelin
10 15
purelin purelin
15 3
purelin purelin
15 5
purelin purelin
15 8
purelin purelin
15 10
purelin purelin
15 15
purelin purelin
33
tansig purelin
35
tansig purelin
38
tansig purelin
3 10
tansig purelin
3 15
tansig purelin
53
tansig purelin
55
tansig purelin
58
tansig purelin
5 10
tansig purelin
5 15
tansig purelin
83
tansig purelin
85
tansig purelin
88
tansig purelin
8 10
tansig purelin
8 15
tansig purelin
10 3
tansig purelin
10 5
tansig purelin
10 8
tansig purelin
10 10
tansig purelin
10 15
tansig purelin
15 3
tansig purelin
15 5
tansig purelin
15 8
tansig purelin
15 10
tansig purelin
15 15
tansig purelin
RMS
110.11
101.46
100.79
99.89
97.14
101.78
96.90
93.12
92.41
89.65
100.15
94.74
92.42
91.91
91.29
97.99
93.75
91.52
89.66
89.32
96.93
92.92
89.76
89.12
90.35
117.41
110.35
106.52
104.34
106.19
105.43
101.04
96.76
94.11
92.29
100.34
93.265
91.50
90.36
90.53
100.75
92.43
89.99
90.37
89.72
96.16
90.46
89.38
87.93
92.54
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

33
tansig tansig
35
tansig tansig
38
tansig tansig
3 10
tansig tansig
3 15
tansig tansig
53
tansig tansig
55
tansig tansig
58
tansig tansig
5 10
tansig tansig
5 15
tansig tansig
83
tansig tansig
85
tansig tansig
88
tansig tansig
8 10
tansig tansig
8 15
tansig tansig
10 3
tansig tansig
10 5
tansig tansig
10 8
tansig tansig
10 10
tansig tansig
10 15
tansig tansig
15 3
tansig tansig
15 5
tansig tansig
15 8
tansig tansig
15 10
tansig tansig
15 15
tansig tansig
33
tansig logsig
35
tansig logsig
38
tansig logsig
3 10
tansig logsig
3 15
tansig logsig
53
tansig logsig
55
tansig logsig
58
tansig logsig
5 10
tansig logsig
5 15
tansig logsig
83
tansig logsig
85
tansig logsig
88
tansig logsig
8 10
tansig logsig
8 15
tansig logsig
10 3
tansig logsig
10 5
tansig logsig
10 8
tansig logsig
10 10
tansig logsig
10 15
tansig logsig
15 3
tansig logsig
15 5
tansig logsig
15 8
tansig logsig
15 10
tansig logsig
15 15
tansig logsig
RMS
122.05
115.65
110.84
108.03
108.32
117.67
111.40
104.12
100.06
96.97
116.08
105.17
100.78
99.05
92.58
114.79
104.51
99.75
95.49
92.54
115.55
105.04
97.74
94.80
91.58
126.31
121.16
115.39
112.54
113.79
120.73
117.93
110.83
106.81
104.96
121.37
111.08
107.47
106.55
100.68
118.47
111.33
106.69
104.07
99.01
119.30
111.37
105.10
102.21
98.76
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

33
logsig purelin
35
logsig purelin
38
logsig purelin
3 10
logsig purelin
3 15
logsig purelin
53
logsig purelin
55
logsig purelin
58
logsig purelin
5 10
logsig purelin
5 15
logsig purelin
83
logsig purelin
85
logsig purelin
88
logsig purelin
8 10
logsig purelin
8 15
logsig purelin
10 3
logsig purelin
10 5
logsig purelin
10 8
logsig purelin
10 10
logsig purelin
10 15
logsig purelin
15 3
logsig purelin
15 5
logsig purelin
15 8
logsig purelin
15 10
logsig purelin
15 15
logsig purelin
33
logsig tansig
35
logsig tansig
38
logsig tansig
3 10
logsig tansig
3 15
logsig tansig
53
logsig tansig
55
logsig tansig
58
logsig tansig
5 10
logsig tansig
5 15
logsig tansig
83
logsig tansig
85
logsig tansig
88
logsig tansig
8 10
logsig tansig
8 15
logsig tansig
10 3
logsig tansig
10 5
logsig tansig
10 8
logsig tansig
10 10
logsig tansig
10 15
logsig tansig
15 3
logsig tansig
15 5
logsig tansig
15 8
logsig tansig
15 10
logsig tansig
15 15
logsig tansig
RMS
126.65
120.57
115.92
114.46
113.48
116.13
111.22
105.66
102.11
99.47
109.41
102.86
98.09
94.47
93.91
110.20
102.04
95.61
95.74
92.07
101.85
97.26
92.90
91.43
91.55
122.77
114.97
108.59
105.43
104.80
119.26
111.48
103.36
100.10
95.90
118.56
105.08
101.52
99.86
93.03
115.71
105.83
100.65
96.69
92.68
118.88
107.36
99.58
96.40
93.07
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

33
logsig logsig
35
logsig logsig
38
logsig logsig
3 10
logsig logsig
3 15
logsig logsig
53
logsig logsig
55
logsig logsig
58
logsig logsig
5 10
logsig logsig
5 15
logsig logsig
83
logsig logsig
85
logsig logsig
88
logsig logsig
8 10
logsig logsig
8 15
logsig logsig
10 3
logsig logsig
10 5
logsig logsig
10 8
logsig logsig
10 10
logsig logsig
10 15
logsig logsig
15 3
logsig logsig
15 5
logsig logsig
15 8
logsig logsig
15 10
logsig logsig
15 15
logsig logsig
RMS
126.31
120.69
113.88
110.74
111.16
122.06
118.14
110.36
106.14
103.40
122.82
111.39
107.13
105.85
99.45
118.97
112.70
106.20
104.47
98.62
121.73
112.47
106.11
102.59
98.71
Annexe D
SCPECG Processor
Description
Pour faciliter le traitement des ECGs enregistres au format SCP-ECG par les outils
daide à la decision developpes dans le cadre dEPI-MEDICS, nous avons developpe un
logiciel autonome (stand-alone) intitule SCP-ECG processor (Figure D.1). Ce logiciel
permet danalyser les ECGs par le biais dune serie de modules qui ont ete developpes.
Il est egalement dote dun module daide à la decision à base de comites de reseaux de
neurones similaire à celui developpe dans le chapitre 2 de ce rapport de thèse et dun
module de synthèse de lECG par regression generique et specifique. De meme ce logiciel
est concu pour integrer tout autre module danalyse, dinterpretation, ou daide à la
decision (les modules de reseaux bayesiens, de logique floue, etc.).
Principaux modules int

egr
es
BuildFake10sEcg Ce module simule un enregistrement dECG de 10 secondes
à partir du complexe median et du rythme cardiaque. Ce module est utile pour
analyser les fichiers SCP-ECP ne contenant que le complexe median.
PermuteFR Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes F et R.
PermuteLF Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes L et F.
PermuteLR Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes L et R.
12-Lead Synthesis Ce module permet à lutilisateur de choisir la methode de
synthèse à employer :
No synthesis : aucune synthèse nest effectuee.
Annexe D. SCPECG Processor
150
Generic 12-Lead Synthesis : La matrice de synthèse generique est utilisee. Cette

matrice est actuellement basee sur un modèle de regression generique.
Patient Specific Regression : une matrice de synthèse specifique au patient est
calculee suivant un modèle de regression sur lECG concerne.
User Specific ANN Synthesis : une matrice de synthèse specifique au patient
est fournie.
Compute Typical Beat and global measurements Ce module applique le
programme de Lyon pour calculer les mesures globales de lECG concerne.
Compute Lead by Lead Measurements Ce module applique le programme de
Lyon pour calculer les mesures, derivation par derivation, de lECG concerne.
Output File to Write Suivant la selection effectuee par lutilisateur, le logiciel
genère differents fichiers en sortie : un nouveau fichier SCP-ECG de lECG, les
mesures globales, les mesures derivation par derivation, les donnees après analyse
en composantes principales de lECG et le resultat de linterpretation de lECG par
comites de reseaux de neurones.
Annexe D. SCPECG Processor
Fig. D.1 Ecran de configuration du logiciel SCP-ECG processor.
151
Annexe E
EPI-MEDICS : mod`
eles de donn
ees
globaux du PEM
Annexe E. EPI-MEDICS : modèles de donnees globaux du PEM
153
Annexe E. EPI-MEDICS : modèles de donnees globaux du PEM
154
Annexe F
Publications
Revues internationales avec comit
e de lecture
H. Atoui, D. Sarrut, S. Miguet. A Fast Morphing-Based Interpolation For Medical Images : Application To Conformal Radiotherapy. Image Anal Stereol, 2006 ;
25(2) :95-103.
H. Atoui, J. Fayn, P. Rubel. A Novel Neural Network Model for Deriving Standard
12-lead ECGs from serial 3-lead ECGs. Application to Self Care. Submitted to
Methods Inf Med.
P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, L. Restier, S. Adami, S. Arod, H.
Atoui, et al. Toward personal eHealth in cardiology. Results from the EPI-MEDICS
telemedicine project. J Electrocardiol, 2005 ;38 :100-106.
Revues nationales avec comit

e de lecture
P. Rubel, J. Fayn, H. Atoui, et al. Intelligence Ambiante et Systèmes Pervasifs
en Telemedecine. Exemple dApplication en Telecardiologie. La Revue des SAMU,
2004 ;26 :521-26.
Chapitre dans un livre

P. Rubel, J. Fayn, L Simon-Chautemps, H. Atoui, et al. New paradigms in Telemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. Stud Health
Technol Inform. 2004 ; 108 :123-32.
Annexe F. Publications
156
Conf
erences internationales avec comit
e de lecture
H. Atoui, J. Fayn, F. Gueyffier, and P. Rubel. Cardiovascular Risk Stratification
in Decision Support Systems, A Probabilistic Approach. Application to pHealth.
Accepted for publication in Computers in Cardiology 2006.
H. Atoui, J. Fayn and P. Rubel. A Neural Network Approach for Patient-specific
12-lead ECG Synthesis in Patient Monitoring Environments. In : Murray A., Ed.,
Computers in Cardiology, Los Alamitos (USA) : IEEE Computer Society, 2004 ;
31 :161-64.
H. Atoui, D. Sarrut, S. Miguet. Usefulness of Image Morphing Techniques in Cancer Treatment by Conformal Radiotherapy. In : Robert L. Galloway, Ed., Medical
Imaging : Visualization, Image-Guided Procedures, and Display, 2004 ; 5367 :332-40.
J. Fayn, C. Ghedira, D. Telisson, H. Atoui, P. Rubel, et al. Towards New Integrated Information and Communication Infrastructures in eHealth. Examples from
Cardiology. In : Murray A., Ed., Computers in Cardiology, Los Alamitos (USA) :
IEEE Computer Society, 2003 ; 30 :113-16.
Conf
erences internationales invit
ees
P. Rubel, J. Fayn, H. Atoui, D. Telisson, P. Chevalier. From eHealth to Pervasive
Solutions and Ambient Intelligence in pHealth. An International Perspective with
Examples from Cardiology. International Initiative for Ubiquitous Healthcare (uHealth), Med-e-Tel, Luxembourg, April 5-7, 2006.
H. Atoui, J. Fayn, P. Rubel. Advanced methods of data fusion of ECG and clinical
data for self-care diagnosis enhancement. 6th STAFF Studies Symposium. September 28 - October 1, 2005.
P. Rubel, J. Fayn, H. Atoui, et al. Pre-hospital acute decision support. 6th STAFF
Studies Symposium. September 28 - October 1, 2005.
J. Fayn, H. Atoui, P. Rubel, et al. Embedded decision making in eCardiology.
Lessons learned from the EPI-MEDICS project. International Workshop on Personalised Health, Belfast, December 13-15, 2004.
P. Rubel, J. Fayn, H. Atoui, D. Telisson. Beyond EPI-MEDICS. In Proceedings of
the 2nd OpenECG Workshop. Integration of the ECG into the EHR & Interoperability of the ECG Device Systelms. Berlin, Germany, April 1-3, 2004 :75-6.
P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al. New paradigms in Telemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. eHealth
Workshop : New generation of wearable systems for health : Towards a revolution
of citizens health and life style management ? Lucca, Italy, December 12-14, 2003.
Annexe F. Publications
157
Conf
erences nationales avec comit
e de lecture
H. Atoui, D. Telisson, et al. Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide à la decision par reseaux
de neurones du projet europeen EPIMEDICS. Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005 : 13-14.
Conf
erences ou journ
ees th
ematiques nationales
H. Atoui. Conception de systèmes intelligents pour la telemedecine citoyenne. Rencontres Regionales de la Recherche, Lyon, 2004 (poster).
S
eminaires
Techniques dimagerie pour laide au positionnement du patient en radiotherapie
conformationnelle. Octobre 2002. Laboratoire ERIC
Conception de Syst`
emes Intelligents pour la T
el
em
edecine
Citoyenne
Hussein ATOUI
R
esum
e
Ces recherches sinscrivent dans la continuite du projet europeen EPIMEDICS (Enhanced Personal Intelligent & Mobile system for Early Detection & Interpretation of Cardiovascular Syndromes) du programme Information Society Technologies,
qui a pour objectif la realisation dun moniteur personnel dECG (PEM) intelligent, dote
dun serveur embarque et dun composant metier danalyse quantitative de lECG, compact, portable et utilisable par tous, y compris par le patient lui-meme, un aidant, ou
nimporte quel citoyen. Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des informations spatio-temporelles produite par lactivite du cur
et capable denvoyer par GPRS ou UMTS differents types de messages ou dalarmes
convoyant des ECG et un mini-dossier medical de lutilisateur. Cest dans ce contexte que
nous avons cherche à ameliorer lintelligence du système en developpant une plateforme
auto-adaptative et auto-evolutive de detection automatique des dysfonctionnements du
coeur. Cette plateforme permet de stratifier le risque de la survenue dun evènement cardiovasculaire moyennant linterpretation de lECG combinee avec lhistorique medical de
lutilisateur.
Laide au diagnostic consiste à mettre en oeuvre des algorithmes resolvant un problème de
classement compte tenu de lincertitude sur la situation reelle de lobjet etudie. Les travaux
presentes dans ce memoire etudient differents aspects de cette tache. Tout dabord, nous
proposons une modelisation du processus de diagnostic de linfarctus à partir de lECG.
Linterpretation automatique de lECG est effectuee à laide de comites de reseaux de
neurones artificiels. Une serie dexperimentations illustre la superiorite des reseaux de
neurones par rapport aux resultats obtenus par des cardiologues interpretant le meme ensemble de donnees. Ensuite, afin dobtenir un diagnostic plus precis et plus personnalise,
nous proposons dinclure une stratification des informations cliniques de lutilisateur telles
que les facteurs de risque. Notre approche consiste à utiliser les reseaux bayesiens pour
etablir une quantification probabiliste du risque cardiovasculaire. Nous proposons enfin
un algorithme permettant de fusionner le score de linterpretation de lECG realisee par
les reseaux de neurones avec celui obtenu par les reseaux bayesiens à partir des facteurs
de risque. Cette fusion constitue lun des fondements de la future plateforme daide à la
decision qui sera embarquee dans le PEM, système qui sera à la fois auto-adaptatif en
fonction de la specificite de chaque utilisateur et auto-evolutive grace au potentiel dapprentissage automatique des reseaux de neurones et des reseaux bayesiens.
Dans la deuxième partie de cette thèse, nous etudions un formalisme permettant de rendre
lECG simplifie du PEM accessible, sous un format comprehensible et interpretable, aux
professionnels de sante. Il sagit de synthetiser un ECG standard 12D à partir de lECG
3D du PEM. Cette synthèse doit permettre non seulement une detection precise, mais
egalement une reproduction la plus fidèle possible des caracteristiques de lECG standard
si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM. Cest la raison
pour laquelle nous nous sommes orientes vers des techniques dintelligence artificielle mettant en uvre une methode originale de reconstruction des ECG basee sur lutilisation
de comites de reseaux de neurones. Une serie de tests sur des bases de donnees dECG
standards et dECG PEM enregistres dans des conditions simulant celles dutilisation du
PEM, a montre que notre approche a largement depasse les methodes conventionnelles.
Enfin, nous avons travaille sur la conception de strategies de deploiement pour la mise en
uvre de methodes de synthèse de lECG specifique à chaque patient au moyen dinfrastructures ad hoc permettant de realiser lapprentissage neuronal à grande echelle, grace
aux technologies des services web et des grilles de calcul.
Mots cl
es Systèmes pervasifs - Intelligence ambiante - Intelligence artificielle - Fusion
de donnees - Aide à la decision - Telemedecine citoyenne

Thèse

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Thèse

Hochgeladen von

Copyright:

Verfügbare Formate

Departement Informatique

Doctorat de lINSA de Lyon

Directeur de Recherche INRIA

INSERM ERM 107, MTIC (Methodologies de Traitement de lInformation en Cardiologie)

` ma famille, mes amis, mon village, mon sud,

Table des mati`

III Conception, validation et strat

3 Acquisition de lECG PEM et synth`

4 Mise en place de la plateforme d

Liste des tableaux

Correlations moyennes (en pourcentage) entre les derivations dorigine et

Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de

Table des figures

ECG standard 12D : positionnement des electrodes, ondes et intervalles.

Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard

Le PEM (Personal ECG monitor) au service de la prevention et la detection

D.1 Ecran de configuration du logiciel SCP-ECG processor. . . . . . . . . . . . 151

Les maladies cardiovasculaires, notamment linfarctus du myocarde1 , comptent parmi

les principales causes de maladie, dinvalidite et de dec`es en Europe et aux Etats-Unis

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Le diagnostic de linfarctus du myocarde sappuie sur la mise en evidence de consequences

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

electrocardiographiques se distinguent par le nombre et la nature des derivations utilisees

LECG standard 12D

LECG standard comporte 12 derivations (Figure 1.1) respectivement enregistrees

Les six derivations precordiales sont definies comme suit :

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

LECG : les diff

Linfarctus du myocarde vu de lECG

Lischemie sous-endocardique se traduit, sur lelectrocardiogramme, par une onde T exagerement

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

apparition dune onde Q, diminution du sus-decalage du segment ST, ainsi quune

Fig. 1.2 Evolution de lECG au cours dun infarctus.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Patients sans sus-decalage du segment ST mais avec une depression du segment ST

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

domicile, au travail, ou en ambulatoire, en combinant analyse automatique dun ECG

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Analyse unaire vs analyse s

Levolution technologique dans le secteur des communications est en voie de

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

La mise en uvre darchitectures de telemedecine necessite la prise en compte des

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Fig. 1.3 Le centre dinteret de linformatique medicale traditionnelle est en train

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Fig. 1.4 Le projet EPI-MEDICS permet, grace `a un syst`eme personnel denregistrement

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

un probl`eme de diagnostic (par exemple, categoriser un ECG en normal ou suspect)

Les principales approches utilis

Les methodes utilisees pour laide au diagnostic rel`event toutes de la reconnaissance de

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

sigmode. . . ), et si le resultat depasse un certain seuil dactivation, alors le neurone envoie

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

Chapitre 2. Aide `a la decision en telecardiologie

botique, linterpretation dimage ou dans notre contexte, la telemedecine. De nombreuses

Il existe de par le monde plusieurs dizaines, voire plusieurs centaines de programmes

Chapitre 2. Aide `a la decision en telecardiologie

Couches, connexions et fonctions dactivation

Chapitre 2. Aide `a la decision en telecardiologie