Sie sind auf Seite 1von 170

Departement Informatique

Ecole
Doctorale Informatique et Information pour la Societe

Conception de Syst`
emes Intelligents
pour la T
el
em
edecine Citoyenne
Th`
ese
presentee et soutenue publiquement le 29 Septembre 2006
pour lobtention du

Doctorat de lINSA de Lyon


(specialite informatique)
par
Hussein Atoui

Composition du jury
Rapporteurs:
Directeurs de th`ese:

Francois Charpillet
Joel Colloc
Paul Rubel

Examinateur

Jocelyne Fayn
Jean-Pierre Boissel

Directeur de Recherche INRIA


Professeur, Universite du Havre
Professeur, INSA de Lyon
Directeur de lINSERM ERM107
Ingenieur de Recherche, INSERM
Professeur, Departement de Pharmacologie Clinique
Faculte RTH Laennec

INSERM ERM 107, MTIC (Methodologies de Traitement de lInformation en Cardiologie)

` ma famille, mes amis, mon village, mon sud,


A
`
A tous les etres chers perdus victimes de la barbarie qui
a ravage le Liban dans lindifference et la complicite du
monde entier,

` tous celles et ceux qui mont aide pendant ces annees, un grand Merci.
A

Table des mati`


eres
Table des mati`
eres

vi

Introduction

II Aide `
a la d
ecision en m
edecine, le projet europ
een EPIMEDICS
5
1 Maladies cardiovasculaires, t
el
em
edecine et aide `
a la d
ecision
1.1 Contexte medical . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Le diagnostic . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Lelectrocardiologie quantitative . . . . . . . . . . . . . . . . . . .
1.2.1 LECG standard 12D . . . . . . . . . . . . . . . . . . . . .
1.2.2 LECG : les differentes ondes et les intervalles de temps . .
1.2.3 LECG, outil de detection du dysfonctionnement cardiaque
1.3 La telemedecine citoyenne : le projet EPI-MEDICS . . . . . . . .
1.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Evolution : passe, present et futur . . . . . . . . . . . . . .
1.3.3 EPI-MEDICS . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Laide `a la decision en medecine . . . . . . . . . . . . . . . . . . .
1.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Les syst`emes daide `a la decision . . . . . . . . . . . . . .
1.4.3 Les principales approches utilisees pour laide `a la decision
1.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

6
6
7
7
8
9
9
14
14
15
17
20
20
20
21
23

III Conception, validation et strat


egies de d
eploiement de la
plateforme d
ecisionnelle dEPI-MEDICS
25
2 Aide `
a la d
ecision en t
el
ecardiologie
2.1 Contexte et objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Interpretation automatique de lECG . . . . . . . . . . . . . . . . . . . .
2.2.1 Les reseaux de neurones . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Conception, realisation et evaluation du module dinterpretation de
lECG par reseaux de neurones . . . . . . . . . . . . . . . . . . .

26
. 26
. 27
. 28
. 34

iv

2.3

2.4

2.2.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Quantification du risque cardiovasculaire par approche probabiliste . . .
2.3.1 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Les reseaux bayesiens . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Apprentissage des reseaux bayesiens . . . . . . . . . . . . . . . . .
2.3.4 Configuration du mod`ele probabiliste de stratification du risque cardiovasculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.5 La base de donnees INDANA . . . . . . . . . . . . . . . . . . . .
2.3.6 Realisation du reseau bayesien . . . . . . . . . . . . . . . . . . . .
2.3.7 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.8 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Vers un mod`ele multi-classifieurs multi-modules du diagnostic de linfarctus : Interaction du module neuronal et du module bayesien dans le processus decisionnel global . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Acquisition de lECG PEM et synth`


ese de lECG standard
3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Modalites dacquisition de lECG PEM . . . . . . . . . . . . . . . . . . .
3.3 Approches conventionnelles . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Bases de donnees dapprentissage et de test . . . . . . . . . . . . . . . . .
3.6 Configuration du mod`ele de synth`ese de lECG standard 12D par reseaux
de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.1 Constitution des ensembles dapprentissage et de test . . . . . . .
3.6.2 Evaluation de la variation naturelle intra-patients entre les ECG de
reference et les ECG durgence . . . . . . . . . . . . . . . . . . . .
3.6.3 Configuration de la structure des reseaux de neurones . . . . . . .
3.6.4 Processus dapprentissage et devaluation . . . . . . . . . . . . . .
3.6.5 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Evaluation diagnostique sur la base de donnees de Lund . . . . . . . . .
3.7.1 Ensemble dapprentissage et ensemble de test . . . . . . . . . . .
3.7.2 Configuration et apprentissage des comites de reseaux de neurones
specifiques aux patients . . . . . . . . . . . . . . . . . . . . . . . .
3.7.3 Comparaison des interpretations automatiques des ECG synthetises
par rapport `a la verite clinique . . . . . . . . . . . . . . . . . . .
3.7.4 Discussion & Conclusion . . . . . . . . . . . . . . . . . . . . . . .
3.8 Evaluation de la qualite de la synth`ese des ECG standards 12D `a partir
des ECG 3D du PEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.2 Population detude . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.3 Pretraitement des ECG . . . . . . . . . . . . . . . . . . . . . . .
3.8.4 Configuration de la structure des reseaux de neurones . . . . . . .

.
.
.
.
.

45
48
50
52
59

.
.
.
.
.
.

60
61
62
64
64
65

. 65
.
.
.
.
.

68
68
69
71
72
73

. 74
. 74
.
.
.
.
.
.
.
.

74
75
76
79
82
82
83
84

. 85
. 85
. 87
.
.
.
.
.

88
88
89
90
91

v
3.8.5 Processus dapprentissage des reseaux de neurones generiques
3.8.6 Processus dapprentissage des reseaux de neurones specifiques
3.8.7 Verification et validation de la synth`ese de lECG 12D . . . .
3.8.8 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

91
93
93
95
105
106

4 Mise en place de la plateforme d


ecisionnelle du PEM
108
4.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
4.2 Etat actuel de developpement du PEM `a letape de prototype . . . . . . . 109
4.2.1 Le PEM : intelligence embarquee dans un environnement pervasif
multi-acteurs de telemedecine citoyenne . . . . . . . . . . . . . . . . 109
4.2.2 Architecture pervasive generique . . . . . . . . . . . . . . . . . . . . 110
4.2.3 Generation et gestion dalarmes . . . . . . . . . . . . . . . . . . . . 111
4.2.4 Detection des arythmies et des ischemies . . . . . . . . . . . . . . . 112
4.2.5 Reconstruction de lECG standard 12D `a partir de lECG PEM 3D 113
4.3 Vers un produit final : strategies de deploiement du module de synth`ese de
lECG embarque dans le PEM . . . . . . . . . . . . . . . . . . . . . . . . . 113
4.3.1 Le PEM, un dispositif autonome . . . . . . . . . . . . . . . . . . . 114
4.3.2 Le PEM, un dispositif semi-autonome . . . . . . . . . . . . . . . . . 114
4.3.3 Scenario dutilisation du module de synth`ese dECG . . . . . . . . . 117
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

IV

Conclusion g
en
erale

120

Bibliographie

124

Annexes

A Dossier M
edical Personnel embarqu
e dans le PEM
A.1 Contenu du dossier de sante du patient . . . . . . . .
A.2 Donnees demographiques . . . . . . . . . . . . . . . .
A.3 Resultats danalyses biologiques . . . . . . . . . . . .
A.4 Elements du dossier cardiologique . . . . . . . . . . .
A.4.1 Donnees cliniques . . . . . . . . . . . . . . . .
A.4.2 Interpretation de lECG au repos . . . . . . .
A.4.3 Resultats des tests de lECG deffort . . . . .
A.4.4 Diagnostic cardiologique . . . . . . . . . . . .
A.4.5 Procedures et traitements . . . . . . . . . . .
A.5 Facteurs de risque cardiovasculaire . . . . . . . . . .
A.5.1 Classe de Sante . . . . . . . . . . . . . . . . .
A.5.2 Facteurs de risque majeurs . . . . . . . . . . .
A.5.3 Autres facteurs de risque . . . . . . . . . . . .

135
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

136
. 136
. 136
. 137
. 137
. 137
. 137
. 138
. 138
. 139
. 139
. 139
. 139
. 140

vi
B La base de donn
ees INDANA

141

C Architecture des r
eseaux de neurones utilis
es pour la synth`
ese de lECG143
D SCPECG Processor

149

E EPI-MEDICS : mod`
eles de donn
ees globaux du PEM

152

F Publications

155

R
esum
e

158

Liste des tableaux


2.1

2.2
2.3

2.4

2.5

2.6
2.7
3.1

3.2

3.3

Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage
est ensuite effectue sur les N 1 sous-ensembles s2 `a S5 et lerreur est calculee sur le sous-ensemble restant s1, servant de validation. Cette operation
est reiteree quatre fois en choisissant chaque fois un ensemble de validation
different. Enfin, un taux derreur moyen est calcule et lapprentissage est
refait en utilisant la totalite de lensemble de donnees. . . . . . . . . . . . .
Matrice de confusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG
durgence de lensemble de test, effectuee par les deux experts, en fonction
de la verite clinique (199 cas dinfarctus (AMI) et 789 cas de controle). Ce
tableau illustre les resultats de linterpretation unaire effectuee sur les ECG
durgence sans avoir eu connaissance des ECG de reference des patients. . .
Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse
serielle) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scores de risque en pourcentage de la survenue dune maladie coronaire en
fonction de lage, du sexe et des caracteristiques de la douleur de thoracique.
Dapr`es Diamond et Forrester, N Engl J Med 1979. . . . . . . . . . . . . .
Illustration du deroulement de lalgorithme de triangulation. Les clusters
retenus pour larbre de jonction sont marques par une etoile (*). . . . . . .
Variables retenues pour realiser les mod`eles de stratification : reseau bayesien,
comite de reseau de neurones et analyse discriminante. . . . . . . . . . . .

33
40

42

43

51
57
61

Correlations moyennes (en pourcentage) entre les derivations dorigine et


les derivations synthetisees au moyen dun mod`ele de regression generique
en fonction du sous-ensemble de derivations ECG 12D utilisees comme
entrees pour la synth`ese. Resultats extraits de [119] portant sur un ensemble
dapprentissage de 72 ECG 12D sans ensemble de test independant. . . . . 71
Erreur quadratique moyenne (RMS) en V entre les derivations DI, DII,
V1, V2, V3, V4, V5 et V6 des ECG de reference et ECG durgence des sous
ensembles DS1, DS2 et DS3, apr`es exclusion des 5 valeurs les plus extremes. 79
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
(r) entre les derivations V1,V3. . . V6 originales et celles synthetisees par
les comites de reseaux de neurones specifiques (ANN-S) et les mod`eles de
regression specifiques (REG-S) sur les ECG des sous-ensembles DS1, DS2
et DS3, apr`es elimination des 5 valeurs les plus extremes. . . . . . . . . . . 81

viii
3.4

3.5

3.6
3.7

3.8

3.9

3.10

3.11

3.12

3.13

3.14

3.15

Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de


la difference en termes derreur RMS obtenue par les comites de reseaux
de neurones et les mod`eles de regression specifiques. . . . . . . . . . . . . . 81
Concordance entre les interpretations des ECG originaux et les interpretations
des ECG synthetises par reseaux de neurones (ANN-S) et par regression
(REG-S). Le logiciel de diagnostic classe les ECG suivant 4 categories de
risque : pas de risque, risque mineur, moyen et majeur. . . . . . . . . . . . 87
Description de la base de donnees CHDB. . . . . . . . . . . . . . . . . . . 89
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du
deuxi`eme ECG Cardiette du sous ensemble SE2, apr`es elimination des 5%
des cas les plus extremes (N=35). . . . . . . . . . . . . . . . . . . . . . . . 96
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations DI, DII et V2 du premier ECG Cardiette et du deuxi`eme
ECG PEM du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . . 96
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations DI, DII et V2 du deuxi`eme ECG Cardiette et de lECG
PEM associe du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . 97
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations V1,V3. . . V6 originales et celles synthetisees par le comite de reseaux de neurones generique (ANN-G) et le mod`ele de regression
generique (REG-G) sur les ECG 2 du sous-ensemble SE2 (N=35). . . . . . 98
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les
comites de reseaux de neurones specifiques (ANN-S) et les mod`eles de
regression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 98
Comparaison par les t-tests (pairwised et trimmed) de la difference en
termes derreurs RMS obtenues par les comites de reseaux de neurones
et les mod`eles de regression generiques et specifiques (N=35). . . . . . . . . 99
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations V1,V3. . . V6 originales des 2`eme ECG 12D de SE2 et
celles synthetisees `a partir des ECG PEM chronologiquement homologues
par le comite de reseaux de neurones generique (ANN-G) et le mod`ele de
regression generique (REG-G) (N=35). . . . . . . . . . . . . . . . . . . . . 100
Erreur quadratique moyenne (RMS) en V et coefficients de correlation
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les
comites de reseaux de neurones specifiques (ANN-S) et les mod`eles de
regression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 100
Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la
difference en termes derreurs RMS obtenues par les comites de reseaux de
neurones et les mod`eles de regression generiques et specifiques lorsque les
entrees sont des ECG PEM (N=35). . . . . . . . . . . . . . . . . . . . . . 101

ix
3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises `a partir des derivations DI, DII et V2 de lECG 12D Cardiette 2
par le comite de reseaux de neurones generiques (ANN-G) et par le mod`ele
de regression generique (REG-G). Le logiciel de diagnostic classe les ECG
suivant 4 categories de risque : pas de risque, risque mineur, moyen et majeur.103
3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques
(REG-S). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits
`a partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 104
3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits
`a partir des derivations DI, DII et V2 de lECG PEM 2. . . . . . . . . . . 105
B.1 Tableau descriptif des variables et labels de la base de donnees INDANA . 142

Table des figures


1.1
1.2
1.3

1.4

1.5

2.1

2.2
2.3
2.4
2.5

2.6
2.7
2.8
2.9

ECG standard 12D : positionnement des electrodes, ondes et intervalles.


Dapr`es the ECG learning center. http ://medlib.med.utah.edu/kw/ecg . 10
Evolution de lECG au cours dun infarctus. . . . . . . . . . . . . . . . . . 11
Le centre dinteret de linformatique medicale traditionnelle est en train
devoluer des professionnels de sante vers les consommateurs (citoyen/patient).
Dapr`es Gunther Eysenbach, Consumer health informatics, BMJ 2000. . . . 16
Le projet EPI-MEDICS permet, grace `a un syst`eme personnel denregistrement de lECG, lorsquun probl`eme est detecte dans lECG dun patient, et
selon le niveau de gravite evalue, de prevenir le medecin du patient et/ou le
service durgence. Les donnees medicales sont alors disponibles sur le Web
et grace `a un acc`es securise, les professionnels de sante peuvent prendre en
charge le patient et orienter correctement ses soins. . . . . . . . . . . . . . 18
Illustration dun des 70 prototypes PEM (Personal ECG Monitor) developpes
dans le cadre du projet EPI-MEDICS pour permettre la detection precoce
des syndromes cardiaques dans un contexte de telemedecine citoyenne. . . 19
Fonctionnement des neurones : chaque neurone m additionne les valeurs de
ses entrees (n1 , n2 , n3 ) multipliees par des poids (W1 , W2 , W3 ), passe le
resultat dans une fonction dactivation, et le renvoie aux neurones qui le
suivent. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Exemples de fonctions dactivation. . . . . . . . . . . . . . . . . . . . . . . 30
Illustration dun reseau de neurones de type perceptron multi-couches. . . . 31
Illustration du fonctionnement du comite de reseaux de neurones unaires/seriels
utilise pour linterpretation de lECG. . . . . . . . . . . . . . . . . . . . . . 39
Comparaison du pouvoir discriminant de deux methodes de classement.
Selon ces deux traces de courbes ROC, la methode A est meilleure que la
methode B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite
obtenu en analyse unaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite
obtenu en analyse serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
Comparaison des courbes ROC des differentes methodes en analyse unaire
et serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
Schema synoptique du processus decisonnel embarque dans le PEM : a)
sa version actuelle ; b) une future version que nous proposons avec lintroduction dun deuxi`eme score de risque base sur le dossier medical du
patient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

xi
2.10 Illustration dalgorithmes de stratification du risque cardiovasculaire developpes
dans le cadre dEPI-MEDICS. . . . . . . . . . . . . . . . . . . . . . . . . . 50
2.11 Reseau bayesien simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.12 Reseau bayesien bug an 2000. . . . . . . . . . . . . . . . . . . . . . . . . 55
2.13 Meme graphe que Figure 2.12 apr`es moralisation. . . . . . . . . . . . . . . 55
2.14 Meme graphe que Figure 2.12 apr`es triangulation. . . . . . . . . . . . . . . 56
2.15 Larbre de jonction obtenu `a partir du reseau bayesien avec les clusters
retenus du processus de triangulation (ovales) et les separateurs induits
(carres). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire. . . . . . . . 63
2.17 Illustration de la structure individuelle des reseaux de neurones utilises
pour estimer le risque cardiovasculaire. . . . . . . . . . . . . . . . . . . . . 64
2.18 Proposition dun mod`ele decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun syst`eme de r`egles de
logique floue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.1
3.2

3.3

3.4
3.5

3.6
3.7
3.8

3.9

Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard


12D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Differents types de mod`eles de synth`ese de lECG 12D `a partir dun sousensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et
1 sortie ; (b) reseau global avec 3 entrees, 5 sorties. . . . . . . . . . . . . .
Illustration de la structure individuelle des reseaux de neurones utilises
pour la synth`ese de lECG 12D : une couche dentree de 3 neurones (DI,
DII, V2), une couche de sortie de 5 neurones (V1, V3, V4, V5, V6), et h
couches cachees de n neurones. . . . . . . . . . . . . . . . . . . . . . . . . .
Programme dinterpretation automatique de lECG suivant 4 niveaux de
risque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Courbes ROC resultant de la comparaison entre la classification des ECG
derives par reseaux de neurones et par regression, par rapport `a la verite
clinique des ECG originaux correspondants. . . . . . . . . . . . . . . . . .
Illustration de lalignement des signaux ECG par correlation croisee. . . . .
Illustration de lapprentissage et de la validation des comites de reseaux de
neurones generiques et specifiques. . . . . . . . . . . . . . . . . . . . . . . .
Visualisation des intervalles de temps utilises pour lapprentissage des comites de reseaux de neurones generiques et specifiques (PT : P-Onset -18
`a T-offset +38 msec) et pour tester leur capacite de generalisation (QT :
Q-onset -18 `a T-offset +38 msec). En cas dabsence de londe P, on remplace le pointeur P-onset par un pointeur virtuel tel que lintervalle PQ
correspondant `a lintervalle PQ moyen. . . . . . . . . . . . . . . . . . . . .
Incidence de la methode de synth`ese de lECG sur la calcul des param`etres
ECG de type syntaxique. A gauche sur lECG dorigine, le trace presente
une petite onde R et une grande onde S. A droite, sur lECG de synth`ese,
aspect typique dit QS. Londe R, microvoltee, na pas ete detectee et par
consequent la duree de londe Q est passee de 0 `a 92 msec et celle de londe
S de 70 msec `a 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

70

76

77
84

86
92
94

95

102

xii
3.10 Illustration de la qualite de synth`ese de lECG standard 12D `a partir de
lECG PEM 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.1
4.2

4.3
4.4
4.5
4.6

Le PEM (Personal ECG monitor) au service de la prevention et la detection


precoce de la survenue devenements cardiovasculaires. . . . . . . . . . . .
Un exemple darchitecture dEPI-MEDICS : un serveur web assure la gestion intelligente des echanges de messages, et des applications clientes distribuees servant `a envoyer et `a recevoir les demandes XML de tele-expertise
via HTTPS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scenario dalarme majeure. . . . . . . . . . . . . . . . . . . . . . . . . . . .
Scenario dalarme moyenne. . . . . . . . . . . . . . . . . . . . . . . . . . .
Grille pervasive au service de la telemedecine. Inspire de David De Roure,
Mobile Medical Monitoring, National e-Science Centre Talk. . . . . . . . .
Scenario dutilisation du module de synth`ese dECG. Le cardiologue acquiert un ECG standard 12D du patient, acc`ede via Internet au serveur
dapplication qui, `a laide dun service web, reserve les ressources necessaires,
calcule et met `a jour les dispositifs de synth`ese dECG par reseaux de neurones dans le PEM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

109

110
111
112
116

118

D.1 Ecran de configuration du logiciel SCP-ECG processor. . . . . . . . . . . . 151

Premi`
ere partie
Introduction

Introduction
Contexte
Les maladies cardiovasculaires representent de nos jours la principale cause de mortalite en France et en Europe [1]. Or, la majorite des dec`es dorigine cardiaque surviennent
dans la phase pre-hospitali`ere [2, 3, 4, 5]. Une detection precoce des differents cardiopathies permettrait dassurer une prise en charge adequate, dameliorer la qualite de vie des
patients et de reduire le co
ut pour la societe. Il sagit l`a de lobjectif ultime du projet europeen EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection &
Interpretation of Cardiovascular Syndromes) [6]. Ce projet, qui sinscrit dans le droit fil
de ce que lon appelle aujourdhui la telemedecine citoyenne, propose la creation dun
syst`eme intelligent portable et utilisable par tous, le PEM (Personal ECG Monitor),
pour detecter les arythmies et diagnostiquer les infarctus d`es lapparition des premiers
symptomes [7]. Moyennant lacquisition dun electrocardiogramme (ECG) par lutilisateur (citoyen/patient), le PEM a pour vocation de stratifier le risque de la survenue dun
ev`enement cardiovasculaire (arythmie, ischemie), de generer differents niveaux dalarmes
et de transmettre les donnees stockees dans le PEM aux professionnels de sante ou aux
structures durgence concernes.
Pour atteindre ces objectifs, il est necessaire de resoudre une variete de probl`emes lies
aux cycles de fonctionnement du syst`eme : de lacquisition et lenregistrement de lECG
`a linterpretation des donnees recueillies, jusqu`a lemission et la gestion des alarmes.
Cela impose de concevoir des solutions innovantes `a ces probl`emes tr`es particuliers lies
`a la telemedecine citoyenne et de developper une plateforme logicielle pervasive basee en
grande partie sur des composants embarques dans le PEM.
Parmi les differentes problematiques `a resoudre, la plus importante et sans doute la
plus difficile est de rendre le syst`eme de decision auto adaptatif en fonction de la specificite
du patient et auto-ameliorant en fonction des eventuelles fausses alarmes ou detections
manquees. Les methodes `a mettre en uvre rel`event des domaines de lintelligence artificielle et de laide `a la decision (fusion des donnees, logique floue, approche neuronale,
etc.).
Partant dune premi`ere solution consistant `a interpreter les ECG standards `a 12

3
derivations (ECG 12D) au moyen de comites de reseaux de neurones, nous chercherons `a
ameliorer lintelligence du syst`eme en stratifiant le risque de survenue dun ev`enement cardiovasculaire en combinant linterpretation de lECG avec lhistorique clinique du patient.
Il sagit en loccurrence dun probl`eme daide au diagnostic consistant `a mettre en uvre
des algorithmes (reseaux de neurones, reseaux bayesiens. . . ) resolvant un probl`eme de classement tenant compte de lincertitude sur la situation reelle de lobjet etudie. Considerant
quil nexiste pas dultime methode, nous essayerons de tirer profit des points forts de
chacune des methodes daide `a la decision existantes en proposant un mod`ele hybride,
multi-experts, multi-modules forme dune combinaison de classifieurs et de methodes de
classement pour interpreter lECG du patient, tout en tenant compte des facteurs de
risque (antecedents cardiaques, cholesterol, tabagisme. . . ) propres `a lutilisateur concerne
afin de declencher lalarme la plus appropriee.
Une deuxi`eme problematique est de permettre lenregistrement de lECG par lutilisateur avec le minimum dassistance professionnelle, et de rendre cet ECG accessible,
sous un format comprehensible et interpretable, aux professionnels de sante (cardiologue,
medecin traitant). Il est donc imperatif de proposer lutilisation dun syst`eme denregistrement simplifie permettant de recueillir lessentiel de linformation spatio-temporelle
contenue dans lECG 12-D avec un nombre minimum delectrodes faciles `a placer par le
patient lui-meme. La solution proposee par le projet EPI-MEDICS est denregistrer un
ECG PEM simplifie consistant en 3 derivations pseudo-orthogonales (DI, DII, V2) formant un sous-ensemble de lECG standard `a 12 derivations, ramenant ainsi le nombre
delectrodes actives necessaires `a lenregistrement de lECG PEM de 9 `a 4. Encore fautil, pour une bonne acceptabilite de lapproche EPI-MEDICS par les professionnels de
sante, proposer des moyens permettant de transformer lECG PEM en ECG 12-D, seule
forme delectrocardiogramme que les cardiologues ont lhabitude dinterpreter avec une
tr`es grande precision. Les methodes habituellement utilisees pour synthetiser un ECG
standard 12-D `a partir dun nombre reduit delectrodes reposent sur des techniques de
regression lineaire multiple. Nous proposons dans ce memoire une methode de reconstruction non-lineaire originale basee sur lutilisation de reseaux de neurones que nous
validerons sur plusieurs bases de donnees ECG serielles que nous avons selectionne pour
etre le plus representatives possible du type de populations detudes concernees par une
utilisation future du PEM. Notre validation sera realisee tant en termes de contenu informationnel vis `a vis de la capacite de detecter un infarctus quen termes de qualite de la
reconstruction des differents echantillons des signaux manquants.
Enfin, nous terminons ce memoire en proposant une architecture de deploiement de
la plateforme decisionnelle du PEM dans le contexte des syst`emes dinformation et de
communication pervasifs integrant des serveurs web applicatifs et des grilles de calcul.
Le chapitre 1 est consacre `a la presentation du contexte medical de nos recherches : les
maladies cardiovasculaires, et en particulier levocation des causes, des effets et consequences
de linfarctus du myocarde. De meme, nous faisons le point sur les differents moyens de
prevention (facteurs de risque) et de diagnostic (ECG) de linfarctus du myocarde. Ensuite, nous presentons le contexte applicatif de la th`ese, `a savoir la telemedecine citoyenne

4
et le projet europeen EPI-MEDICS, tout en mettant laccent sur le produit phare du projet : le PEM. Enfin, nous abordons la discipline daide `a la decision en medecine et les
principales techniques dintelligence artificielle utilisees en informatique medicale pour
diagnostiquer une pathologie `a partir dindicateurs preleves sur le patient (ECG. . . ).
Le chapitre 2 presente la plateforme daide `a la decision que nous avons developpee
pour diagnostiquer linfarctus du myocarde. La realisation de cette plateforme est basee
sur une approche multi-modules, multi-experts utilisant des methodes de classement du
domaine de lintelligence artificielle. Elle permet detablir une probabilite de la survenue
de lev`enement cardiovasculaire `a partir de :
Linterpretation de lECG PEM : Cette interpretation est effectuee `a laide de comites de reseaux de neurones artificiels sur les ECG enregistres par lutilisateur
lui-meme.
La stratification des facteurs de risque : il sagit destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur les facteurs de risque, les
donnees cliniques, etc. prealablement stockes dans le dossier medical de lutilisateur
du PEM. Nous proposons une solution `a base de reseaux bayesiens.
Enfin, pour combiner linterpretation de lECG avec le resultat de la stratification
des facteurs de risque, nous proposons un mod`ele decisionnel global incorporant les
modules bayesien et neuronal qui collaborent par lintermediaire dun syst`eme de
r`egles de logique floue.
Le chapitre 3 est devolu `a la presentation de solutions permettant la reconstruction de
lECG standard 12D `a partir de lECG PEM 3D enregistre par lutilisateur du PEM. Lobjectif est de permettre non seulement une detection precise de lischemie, mais egalement
une reproduction la plus fid`ele possible des caracteristiques enregistrees par lECG 12D
standard si ce dernier etait enregistre simultanement avec lECG 3D du PEM. Nous proposons deux approches : lune generique visant `a construire un module de synth`ese applicable
`a tout patient, lautre specifique `a chaque patient, et des solutions `a base de comites de
reseaux de neurones artificiels que nous comparerons `a des solutions plus traditionnelles
basees sur la synth`ese au moyen de matrices de transformations lineaires obtenues par
regression lineaire multiple.
Enfin, le chapitre 4 est consacre `a la presentation des aspects lies au deploiement et
`a la maintenance des modules daide `a la decision du PEM, en particulier le module
neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes,
ainsi que les strategies de deploiement du module de reconstruction de lECG par comites
de reseaux de neurones.

Deuxi`
eme partie
Aide `
a la d
ecision en m
edecine, le
projet europ
een EPI-MEDICS

Chapitre 1
Maladies cardiovasculaires,
t
el
em
edecine et aide `
a la d
ecision
1.1

Contexte m
edical

Les maladies cardiovasculaires, notamment linfarctus du myocarde1 , comptent parmi

les principales causes de maladie, dinvalidite et de dec`es en Europe et aux Etats-Unis


et avec le vieillissement des populations, le nombre de dec`es dorigine cardiaque ira sans
doute en croissant. Or, la majorite des dec`es dorigine cardiaque surviennent dans la phase
pre-hospitali`ere [2, 3, 4, 5].
Une detection precoce des premiers symptomes dune cardiopathie permettrait tr`es
probablement dassurer une meilleure prise en charge et en consequence adequate, dameliorer
la qualite de vie des patients et de reduire le co
ut pour la societe.
Plusieurs etudes epidemiologiques ont en effet montre limpact potentiel en termes
de mortalite et de morbidite cardiaque dune diminution de la duree entre lapparition
des symptomes et la prise en charge effective des patients [2]. Quand importe plus
que o`
u [3]. Il faudrait en pratique arriver `a reduire le temps separant lapparition des
symptomes et le debut des traitements `a moins de deux heures contre quatre en moyenne
actuellement. Or comme on va le voir ci-apr`es, le probl`eme nest pas simple. Meme les
meilleurs experts se trompent parfois. Et lischemie cardiaque peut etre instable : presente
au domicile du patient, elle peut avoir disparu `a larrivee au service des urgences, pour
reapparatre quelques heures apr`es quand le patient est revenu `a domicile. Do`
u linteret
des solutions de telemedecine citoyenne telles que celles proposees par EPI-MEDICS que
nous evoquons dans la derni`ere partie de ce chapitre.
1

Linfarctus du myocarde est la consequence dune occlusion coronaire brutale. Cela declenche une
ischemie myocardique regionale sev`ere qui, si elle se perennise, engendre des lesions cellulaires irreversibles.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

1.1.1

Le diagnostic

Le diagnostic de linfarctus du myocarde sappuie sur la mise en evidence de consequences


cliniques et biologiques [8, 9, 10, 11, 12].

Le diagnostic clinique
Le symptome classique de linfarctus du myocarde dans sa forme typique est la douleur thoracique. Cette douleur dure au moins 20 minutes, elle est violente, parfois insupportable. Elle irradie souvent aux membres superieurs vers le bord cubital, la machoire
inferieure. Elle peut egalement irradier vers lepigastre, mais jamais en dessous de lombilic.
Linfarctus du myocarde debute presque toujours sans cause declenchante evidente,
avec un horaire dapparition predominant dans les heures de la matinee, mais pouvant
setaler sur lensemble des 24 heures. Il peut apparatre au cours dun effort physique, par
exemple sportif ; dans ce cas larret de leffort ne permet pas de le faire ceder. La douleur
peut etre absente, la symptomatologie peut alors se limiter `a des signes digestifs (nausees,
vomissement, gene epigastrique, etc.).

Le diagnostic biologique
Les lesions cellulaires causees par linfarctus entranent une perte detancheite membranaire, voire une lyse de la membrane cellulaire. Il en resulte une liberation de molecules
intra-cytoplasmiques. D`es lors des enzymes myocardiques (la myoglobine, la myosine, etc.)
seront retrouvees dans le sang peripherique, et peuvent y etre reperees via une analyse
biologique.

1.2

L
electrocardiologie quantitative

Le diagnostic precoce de linfarctus nest pas chose facile. Les douleurs thoraciques
peuvent avoir dautres causes que linfarctus, et certains episodes ischemiques sont silencieux, notamment en cas de diab`ete. Le seul element daide `a la decision objectif et facile
`a mettre en uvre en situation pre-hospitali`ere pour faire le diagnostic dun evenement
cardiaque et de sa severite (angine de poitrine, infarctus aigu, risque de dec`es, etc.) et
pour guider les traitements est lelectrocardiogramme (ECG) [13].
LECG est une representation de lactivite electrique du coeur enregistree par
des electrodes placees sur la surface du corps. Les differents modes denregistrements

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

electrocardiographiques se distinguent par le nombre et la nature des derivations utilisees


ainsi que par les eventuelles transformations lineaires qui leur sont appliquees. Les deux
techniques dinvestigations les plus repandues actuellement sont :
lECG 12D (12 derivations)
lECG 3D, ou le vectocardiogramme (VCG)
Nous ne traitons pas le VCG dans ce rapport, car son utilisation est tr`es peu repandue.

1.2.1

LECG standard 12D

LECG standard comporte 12 derivations (Figure 1.1) respectivement enregistrees


dans le plan frontal et selon des directions parall`eles au plan horizontal (derivations
precordiales).
Les six derivations frontales sont habituellement identifiees comme suit :
DI : mesure de la difference de potentiel (DDP) bipolaire entre le bras droit et le
bras gauche.
DII : mesure de la DDP bipolaire entre le bras droit et la jambe gauche.
DIII : mesure de la DDP bipolaire entre le bras gauche et la jambe gauche.
aVR : mesure du potentiel unipolaire augmente du bras droit.
aVL : mesure du potentiel unipolaire augmente du bras gauche.
aVF : mesure du potentiel unipolaire augmente de la jambe gauche.
DIII, aVR, aVL et aVF peuvent etre calcules `a partir de DI et DII comme suit :
1. DIII = DII - DI
2. aVR = -0.5(DI+DII) =
3. aVL = DI - 0.5DII =
4. aVF = DII - 0.5DI =

3
2
3
2

3
2

VR

VL
VF

Les six derivations precordiales sont definies comme suit :


V1 mesure le potentiel unipolaire de lelectrode V1 situee sur le 4`eme espace intercostal droit, `a droite du sternum.
V2 mesure le potentiel unipolaire de lelectrode V2 sur le 4`eme espace intercostal
gauche, au bord gauche du sternum.
V3 est situee entre V2 et V4.
V4 est situee sur le 5`eme espace intercostal gauche, sur la ligne medioclaviculaire.
V5 est situee sur le 5`eme espace intercostal gauche, sur la ligne axillaire anterieure.
V6 est situee sur le 5`eme espace intercostal gauche, sur la ligne axillaire moyenne.
Les potentiels unipolaires V1-V6 et VR, VL, VF sont obtenus en mesurant la DDP
entre chacune des electrodes concernees et la borne controle de Wilson qui est le potentiel
moyen de VR, VL et VF.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

1.2.2

LECG : les diff


erentes ondes et les intervalles de temps

LECG est le temoin direct de differentes phases cycliques (Figure 1.1), indiquant les
grandes etapes de lactivation electrique du coeur :
la depolarisation des oreillettes : onde P
la depolarisation des ventricules : onde QRS
la repolarisation des ventricules : onde T
Les intervalles de temps generalement consideres sont, outre la duree de QRS :
la duree dune depolarisation et repolarisation ventriculaire : intervalle QT
la duree dun cycle ventriculaire complet : intervalle RR
la duree dun cycle atrial complet : intervalle PP

1.2.3

LECG, outil de d
etection du dysfonctionnement cardiaque

De nos jours, LECG est considere comme un moyen fiable, non-invasif, de faible
co
ut, et surtout de detection precoce dun nombre considerable danomalies cardiaques
(infarctus, arythmie, etc. ) qui depasse de loin les techniques dimagerie habituelles. En
plus, lapport technologique a ouvert une nouvelle `ere de lexploration du champ electrique
cardiaque baptisee lelectrocardiologie quantitative, ou numerique.

Linfarctus du myocarde vu de lECG


Linfarctus du myocarde commence par une reduction, voir une rupture, brutale de
lapprovisionnement sanguin dune region du coeur. Ensuite une serie devenements est
declenchee en commencant par une ischemie sous-endocardique2 ou transmurale, suivie de
la necrose3 , et la fibrose si lapprovisionnement sanguin ne retourne pas `a la normale dans
un delai approprie. Les variations de lECG refletant cet ordre suivent habituellement
un mod`ele bien connu selon la localisation et la gravite de linfarctus. En general, plus
le nombre de derivations detectant un infarctus est grand, plus grave est le pronostic.
Levolution classique dun infarctus du myocarde vu `a travers lECG comporte les etapes
suivantes (en supposant que lECG precedant linfarctus etait normal, Figure 1.2A) :
augmentation de lamplitude et de la largeur de londe T ; dans certains cas, apparition dun sus-decalage du segment ST (Figure 1.2B)
sus-decalage du segment ST (ST-elevation) accompagne dune certaine variation de
londe T (Figure 1.2C)
2

Lischemie sous-endocardique se traduit, sur lelectrocardiogramme, par une onde T exagerement


positive
3
Degenerescence des cellules et des tissus attribuable `a un defaut de vascularisation qui empeche une
irrigation sanguine normale

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

10

Fig. 1.1 ECG standard 12D : positionnement des electrodes, ondes et intervalles. Dapr`es
the ECG learning center. http ://medlib.med.utah.edu/kw/ecg

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

11

apparition dune onde Q, diminution du sus-decalage du segment ST, ainsi quune


inversion de londe T, ce qui correspond `a une necrose (Figure 1.2D)
onde Q et inversion de londe T, ce qui correspond `a la fois `a une necrose et une
fibrose (Figure 1.2E)
onde Q et normalisation de londe T (fibrose) (Figure 1.2F)

Fig. 1.2 Evolution de lECG au cours dun infarctus.


Les Crit`
eres ESC de diagnostic de linfarctus
En ao
ut 2000, la Societe Europeenne de Cardiologie (ESC) a publie un document
consensuel repertoriant les crit`eres `a utiliser pour faire un diagnostic de linfarctus aigue du
myocarde [14]. La liste des changements observes sur lECG indiquant une ischemie myocardique susceptible devoluer en infarctus de myocarde est etablie comme suit :
Patients avec sus-decalage du segment ST 0.2 V dans au moins 2 derivations
contigues des derivations V1, V2, et V3, ou 0.1 V dans les autres derivations.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

12

Patients sans sus-decalage du segment ST mais avec une depression du segment ST


ou/et des anomalies de londe T dans au moins 2 derivations contigues, en plus dune
inversion symetrique de londe T presente dans au moins 2 derivations contigues.
Laffinement regulier des crit`eres de diagnostic de linfarctus et la decouverte et la
mise au point de nouveaux marqueurs biologiques, electriques. . . permet `a chaque fois
un meilleur depistage des patients `a risque dinfarctus. Neanmoins, le probl`eme nest
pas compl`etement resolu : le nombre de faux negatifs (detections manquees) est encore
significatif.
En effet, dans une etude publiee en 1993, McCarthy et al [15] ont montre quau moins
25% des patients qui avaient un infarctus du myocarde ont ete renvoyes de lhopital sans
traitement `a cause dune sous-estimation du sus-decalage du segment ST. De meme, 80%
des patients admis dans des unites de soins coronariens consecutivement `a des indications
suggerant un infarctus du myocarde sont renvoyes sans pouvoir confirmer un diagnostic
dinfarctus [16, 17]
Plus recemment, en 2000, Pope et al. [18] ont etudie lincidence des facteurs lies au sexe,
race, absence des caracteristiques habituelles des ischemies cardiaques. . . sur lincapacite
de detecter une ischemie cardiaque chez des patients admis `a lhopital pour suspicion
dischemie. Sur la population detude de plus de 10000 patients (889 patients avec un
infarctus aigu et 966 patients avec une angine de poitrine instable), 2.1 % des patients
avec un infarctus et 2.3 % avec une angine instable nont pas ete detectes. En plus, les
patients qui avaient une ischemie cardiaque mais qui etaient :
de sexe feminin de moins de 55 ans (odds ratio4 de 6.7),
non-blancs (odds ratio de 2.2),
se plaignant dun souffle court (odds ratio de 2.7),
ou ayant un ECG normal (odds ratio de 3.3),
etaient moins susceptibles detre detectes et par la suite hospitalises. De meme, selon cette
etude, les patients avec un infarctus aigu qui etaient :
non-blancs (odds ratio de 4.5),
ou ayant un ECG normal (odds ratio de 7.7),
etaient moins susceptibles detre hospitalises. De plus, seulement 410 des 1445 patients
ayant une ischemie myocardique presentaient sur leur ECG recueilli lors de leur admission
au service des urgences, les crit`eres ECG standards de presence dune ischemie. Enfin, les
etudes qui ont suivi [19], [20], . . . ont confirme ces constatations et reaffirme linteret
majeur de continuer `a affiner les crit`eres de diagnostic de linfarctus. Do`
u linteret du
travail presente dans ce memoire qui vise `a mettre au point un procede intelligent de
surveillance medicale `a la portee du grand public permettant de detecter les patients
`a risque d`es la survenue dun evenement cardiaque, nimporte o`
u, nimporte quand, `a
4
un odds ratio est le rapport entre la probabilite de contracter la maladie en presence de certains
facteurs ou caracteristiques et la probabilite de la contracter dans le cas contraire. Un odds ratio de 4
signifie quune personne ayant la caracteristique `a letude est quatre fois plus susceptible detre affectee
que quelquun qui ne les presente pas, tandis quun odds ratio de 0,5 signifie quelle lest moitie moins.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

13

domicile, au travail, ou en ambulatoire, en combinant analyse automatique dun ECG


simplifie et prise en compte du contexte clinique du patient.

Lanalyse et linterpr
etation automatique des ECG
Lav`enement de lECG numerique et le developpement de linformatique ont rendu
possible lanalyse et linterpretation automatique des ECG.
Les premiers travaux remontent au debut des annees 60. Mais lECG nest devenu
veritablement numerique quavec lapparition des microprocesseurs au milieu et `a la fin
des annees 70. Aujourdhui au moins 90% des electrocardiographes vendus aux Etats
Unis ou en Europe incluent un module danalyse et dinterpretation automatique des
ECG. Il sagit, `a notre connaissance, dune des rares applications medicales pour laquelle
les syst`emes experts sont sortis des laboratoires de recherche et sont utilises en routine
clinique dans des environnements differents de leur lieu dorigine. Ceci na ete rendu
possible que grace `a une action de recherche internationale concertee qui a dure plus de
15 ans et a permis de constituer differentes bases de donnees permettant de valider les
algorithmes danalyse et dinterpretation automatique de lECG, laction CSE Common
Standards for quantitative Electrocardiography [21].
Typiquement, un outil informatique danalyse automatique de lECG consiste en un
ensemble de modules permettant lacquisition du signal, lanalyse et linterpretation du
rythme, la detection dun complexe QRS type, la reconnaissance des differentes ondes,
lextraction dun ensemble de param`etres destines `a caracteriser le signal et son affectation
`a une ou plusieurs classes de diagnostic, cest `a dire realisant les differentes etapes de ce
que lon appelle plus communement une reconnaissance de formes.
Lapproche traditionnelle est principalement basee sur des descripteurs morphologiques et temporels du signal familiers aux cliniciens tels que la presence ou labsence
dune onde Q, le rapport de R/S. . . La deuxi`eme approche extrait des descripteurs quantitatifs au moyen doutils mathematiques tels que la transformee de Fourier, lanalyse
en ondelettes, etc. Ces descripteurs sont par la suite utilises par des methodes issues de
lintelligence artificielle (analyse discriminante, reseaux de neurones, logique floue, ou des
syst`emes `a base de r`egles) pour realiser une interpretation automatique de lECG [22].
Plusieurs dizaines de syst`emes danalyse automatique de lECG ont ete developpes
[23], mais tr`es peu ont ete experimentes en milieu hospitalier, dont notamment le syst`eme
danalyse et dinterpretation automatique des ECG/VCG connu sous le nom de Syst`eme
de Lyon. Ce syst`eme permet lenregistrement dECG 12D ou de VCG, la determination
du complexe QRS type `a laide dun algorithme de classification non hierarchique, et
realise linterpretation automatique du contour grace `a une approche de type heuristique
mettant en uvre des logiques ternaires (alg`ebre de Post) [24]. Plus recemment, dautres
syst`emes bases sur des methodes issues de lintelligence artificielle (logique floue, syst`emes

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

14

experts, reseaux de neurones, etc.) ont ete developpes et commencent `a etre implantes en
milieu hospitalier, en ambulatoire ou `a domicile [7].

Analyse unaire vs analyse s


erielle La plupart des programmes dinterpretation automatique de lECG evoques ci-dessus realisent ce que lon appelle une analyse unaire,
cest `a dire quils analysent un seul ECG par patient sans tenir compte des autres ECG
eventuels du patient. Cependant, malgre linteret suscite par lanalyse unaire de lECG
au cours des derni`eres decennies et la multitude de methodes qui ont dej`a vu le jour, la
performance des programmes automatises bases sur lanalyse unaire est encore limitee.
La precision diagnostique globale ne depasse gu`ere le chiffre de 80 % [25]. Le constat doit
etre tempere par le fait que la precision diagnostique des meilleurs cardiologues lorsquils
ont `a leur disposition un seul ECG est elle meme limitee `a environ 82-83%.
Ceci est imputable au fait que lapproche unaire ne prend pas suffisamment en compte
la specificite du patient. La tendance au cours de ces derni`eres annees fut donc de
developper des syst`emes danalyse dite serielle [22, 26, 27, 28, 29] o`
u le patient est
considere comme sa propre reference. Linterpretation de lECG concerne est alors etablie
en termes devolution par rapport aux enregistrements precedents. Cette tendance vaut
aussi pour linterpretation humaine. Dans un recent document consensuel de lACC/AHA
(American College of Cardiology/American Heart Association) [13], les cardiologues sont
eux aussi incites `a ameliorer leur interpretation de lECG en le comparant par rapport `a
un ECG de reference. En dautres termes, il faut tenir compte de levolution serielle des
ECG.

1.3

1.3.1

La t
el
em
edecine citoyenne : le projet EPIMEDICS
Introduction

Levolution technologique dans le secteur des communications est en voie de


revolutionner les relations entre les individus et les collectivites. De facon plus specifique,
lav`enement des nouvelles technologies de linformation et des telecommunications (NTIC)
permet denvisager de nouvelles facons dexercer la medecine, et doffrir des services
medicaux specialises ou ultraspecialises dans des environnements (`a domicile, en ambulatoire, etc.) qui, jusqu`a maintenant, nont pu en beneficier. Il sagit de la telemedecine
ou medecine dite `a distance. La telemedecine se definit comme etant lunion des
telecommunications et de la medecine [30, 31]. Elle consiste `a utiliser les nouvelles technologies de linformation pour [32] :
effectuer des consultations `a distance : teleconsultation (par exemple, transmission
dECG `a un autre etablissement pour avis sans necessairement transferer le patient)

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

15

[33],
interpreter des donnees medicales `a distance : teleexpertise (par exemple, interrogation dun specialiste en lui transmettant les donnees sur le patient pour un diagnostic
complementaire) [34, 35],
ou assurer une surveillance `a domicile des patients : telesurveillance (par exemple,
suivi des personnes agees `a domicile [36, 37], suivi dune grossesse `a risque, etc.).

1.3.2

Evolution : pass
e, pr
esent et futur

La mise en uvre darchitectures de telemedecine necessite la prise en compte des


elements suivants : des reseaux ouverts, des bases de donnees medicales, des moyens de
representation et dechange de donnees biomedicales numeriques, des outils et des interfaces de communication multi-acteurs et multimedias, des algorithmes de detection
immediate danomalies, des outils et des interfaces de representation dynamique des
donnees. De nombreux projets europeens, dans le cadre des programmes AIM (Advanced
Informatics in Medicine) et Health Telematics ont permis de realiser des avancees significatives dans ce domaine en creant de nouveaux concepts et des standards `a chaque niveau
de cette architecture [38, 39, 40, 41].
Ainsi, en cardiologie, une premi`ere etape, sans doute la plus fondamentale pour louverture des syst`emes dinformation medicale au benefice de la Sante Publique, a ete la
conception et limplementation du protocole de communication standard SCP-ECG (Standard Communications Protocol for Computerized Electrocardiography) [42, 43, 44]. Ce
protocole propose un standard universel pour lechange de donnees ECG (contenu et format des donnees), donne des directives pour lencodage des signaux ECG, et inclut aussi
un protocole de transport approprie, le tout base sur le mod`ele OSI. Une deuxi`eme etape
a ete le developpement dun mod`ele conceptuel de reference pour larchivage des donnees
electrocardiographiques pouvant etre transmises via le protocole SCP-ECG, et compatible
avec toutes les options de ce dernier. Ce mod`ele est lun des resultats majeurs du projet DIPE (Open European Data Interchange and Processing for Electrocardiography,
1992-1995) [45, 46].
Mais le contexte societal actuel est en train de changer. Du fait du vieillissement des
populations. . . , on soriente de plus en plus vers des approches de type soins `a domicile
et de self-care et plus generalement vers la telemedecine citoyenne.
La principale consequence est une reorientation fondamentale des centres dinteret de
linformatique medicale qui ne sont plus focalises sur les professionnels de sante mais sur
les consommateurs (citoyens/patients) (Figure 1.3). Le patient devient lacteur principal
du syst`eme `a linstar dEPI-MEDICS o`
u le patient enregistre ses propres ECG et documente ses propres symptomes. Cette evolution est favorisee par une utilisation de plus
en plus frequente de syst`emes embarques intelligents et communicants et la federation de
differents faits et acquis issus de la recherche : lutilisation des syst`emes dinformation, le

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

16

Fig. 1.3 Le centre dinteret de linformatique medicale traditionnelle est en train


devoluer des professionnels de sante vers les consommateurs (citoyen/patient). Dapr`es
Gunther Eysenbach, Consumer health informatics, BMJ 2000.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

17

developpement dinfrastructures de communication pervasives, mobiles et faciles `a utiliser, la miniaturisation la plus importante possible des microcomposants, la baisse de leur
co
ut et laugmentation de leurs performances, et la construction de syst`emes de gestion
bases sur le contexte et des interfaces naturelles et personnalisees.
Un exemple type de cette evolution vers la telemedecine citoyenne est le projet EPIMEDICS, que nous presentons bri`evement ci-apr`es.

1.3.3

EPI-MEDICS

Le projet EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection
& Interpretation of Cardiovascular Syndromes) (Figure 1.4) a deux objectifs principaux
[47] :
detecter, aussitot que possible, le debut dune ischemie ou dune arythmie en enregistrant les changements des ECG des patients `a risque,
impliquer sans delai, mais seulement si necessaire, les structures de sante.
Pour realiser ces objectifs et en particulier pour detecter de mani`ere precoce les dysfonctionnements cardiaques d`es lapparition des premiers symptomes, `a domicile ou en
ambulatoire, EPI-MEDICS a developpe un moniteur personnel dECG (PEM : Personal
uteux, de petite taille, intelligent et facile dutilisation,
ECG Monitor) (Figure 1.5) peu co
dote dun serveur embarque et dun composant metier danalyse quantitative de lECG.
Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des
informations spatio-temporelles produite par lactivite du cur et denvoyer via Bluetooth
et GPRS ou UMTS differents types de messages ou dalarmes convoyant des ECG et un
mini-dossier medical de lutilisateur aux services de sante concernes, grace `a des telephones
portables de 2`eme ou 3`eme generation. Le seul equipement requis pour les professionnels
de sante est une connexion Internet. Tous les messages du patient aux medecins sont ecrits
en XML [48] et encapsulent les donnees des ECG suivant le standard SCP-ECG. Ce mode
de fonctionnement est cense faciliter lacceptation du PEM par les professionnels de sante
et devrait permettre une tr`es large diffusion de ce concept.
Le syst`eme de decision embarque dans le PEM comporte quatre sous-ensembles :
detection des arythmies 5 , des ischemies 6 , generation dalarmes et de leur niveau prenant
si possible en consideration des informations cliniques telles que les facteurs de risque du
patient, gestion de lenvoi des alarmes tenant compte des non-reponses eventuelles des
serveurs dalarme ou des professionnels de sante contactes, etc.
5

Der`eglement dans le syst`eme de conduction electrique du coeur (rythme trop lent lorsquil sagit de
bradycardie ; ou trop rapide, on parle alors de tachycardie) pouvant entraner des consequences plus ou
moins graves : etourdissements, nausees, vertiges, palpitations, douleurs, etc.
6
Arret ou insuffisance de la circulation sanguine dans une partie du corps ou un organe, qui prive les
cellules dapport doxyg`ene et entrane leur necrose. Les infarctus sont consecutifs `a des ischemies.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

18

Fig. 1.4 Le projet EPI-MEDICS permet, grace `a un syst`eme personnel denregistrement


de lECG, lorsquun probl`eme est detecte dans lECG dun patient, et selon le niveau de
gravite evalue, de prevenir le medecin du patient et/ou le service durgence. Les donnees
medicales sont alors disponibles sur le Web et grace `a un acc`es securise, les professionnels
de sante peuvent prendre en charge le patient et orienter correctement ses soins.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

19

Fig. 1.5 Illustration dun des 70 prototypes PEM (Personal ECG Monitor) developpes
dans le cadre du projet EPI-MEDICS pour permettre la detection precoce des syndromes
cardiaques dans un contexte de telemedecine citoyenne.
La realisation de la plateforme decisionnelle du PEM na ete rendue realisable que
grace `a lapport de differentes techniques dintelligence artificielle automatisant les processus daide `a la decision implementes dans le PEM. Tous ne sont dailleurs pas encore
operationnels. Seuls ont ete experimentes sur le terrain une premi`ere version des modules
de detection darythmies et dischemie et de generation des alarmes. Leur optimisation
et plus particuli`erement la prise en compte des informations cliniques pour ameliorer la
decision constituent justement lun des principaux apports de ce memoire.
Dans la suite de ce chapitre, nous exposerons bri`evement levolution de laide `a la
decision en medecine, en mettant laccent sur les syst`emes daide `a la decision et en general
les principales methodes developpees dans le cadre de cette discipline. Dans le chapitre
2, nous presenterons en detail les techniques que nous avons adoptees pour concevoir les
modules decisionnels susceptibles detre integres dans la plateforme daide `a la decision
du PEM : le module dinterpretation de lECG et celui de la stratification des facteurs de
risque. Enfin, dans le chapitre 4, nous presenterons les aspects lies au deploiement de ces
modules daide `a la decision, des modules de gestion et denvoi dalarme, . . . qui ont ou
qui vont etre installes dans le PEM.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

1.4
1.4.1

20

Laide `
a la d
ecision en m
edecine
G
en
eralit
es

La medecine est une discipline qui requiert une prise de decision. Ce processus resulte
de la confrontation dun probl`eme reel `a lexperience acquise (savoir-faire) et `a un corpus
de connaissances theoriques (savoir) dans le but deffectuer un choix. La difficulte de la
prise de decision en medecine vient de la situation dincertitude, qui tient `a plusieurs
raisons :
lincertitude sur les connaissances : certaines connaissances sont dordre statistique
et sont associees par nature `a un risque derreur, mais dautres connaissances sont
incompl`etes, par defaut dexploration ;
lincertitude sur les faits : la description de letat present nest jamais parfaite, soit
par manque de moyens ou de temps (urgence), soit par defaut de mesure ou mauvaise
interpretation dun symptome, dun signe ou dun resultat ;
lincertitude du langage : le flou et lambigute des notions manipulees perturbent
le traitement et la transmission de linformation.

1.4.2

Les syst`
emes daide `
a la d
ecision

Les avancees de linformatique et plus particuli`erement lav`enement des syst`emes dinformation, les bases de donnees, les dossiers informatises, etc. ont facilite la prise de
decision medicale en ameliorant lacc`es aux donnees pertinentes. Neanmoins, il ne sagit
l`a que dune aide indirecte facilitant lacc`es aux presentations des faits sur lesquels le praticien doit appliquer un raisonnement. Les syst`emes daide `a la decision vont beaucoup
plus loin : ils ont lambition dassister lhomme, et dans certaines situations, en particulier `a domicile ou en ambulatoire, `a le suppleer en remplacant ou en reproduisant le
raisonnement humain [49].

Caract
eristiques
Plusieurs caracteristiques permettent de decrire les syst`emes daide `a la decision suivant le type de probl`eme `a resoudre, le mode dintervention, la nature de linteraction, ou
enfin la technique employee.

Applications
Les syst`emes daide `a la decision peuvent sappliquer `a deux types de probl`emes :

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

21

un probl`eme de diagnostic (par exemple, categoriser un ECG en normal ou suspect)


dans le but de separer ce qui est de ce qui nest pas, compte tenu de lincertitude
sur la situation reelle de lobjet detude ;
un probl`eme doptimisation dans le but dindiquer la demarche la plus efficace (par
exemple, une strategie therapeutique) compte tenu de lobjectif et des contraintes
(co
ut, risque, difficulte, environnement).

Fonctionnement
Plusieurs modes de fonctionnement sont possibles :
le mode passif suppose lintervention explicite et directe de lutilisateur pour decrire
le probl`eme (par exemple, letat du patient) et interroger le syst`eme.
le mode semi-actif correspond `a un syst`eme dont le declenchement automatique
repond `a une intervention humaine (par exemple, le syst`eme dalarme qui alerte sur
un changement detat du patient, comme dans le cadre dEPI-MEDICS).
le mode actif est celui dun syst`eme `a declenchement automatique et autonome (par
exemple, un syst`eme de telesurveillance).

1.4.3

Les principales approches utilis


ees pour laide `
a la d
ecision

Les methodes utilisees pour laide au diagnostic rel`event toutes de la reconnaissance de


formes. Des centaines darticles et de livres ont ete ecrits sur le sujet [50]. Les principales
approches sont : lapproche statistique, syntaxique, les syst`emes `a base de connaissances,
les reseaux de neurones. Il nest pas dans notre objectif de presenter en detail lensemble
des methodes developpees par le passe, mais juste celles qui nous semblent les plus pertinentes dans notre contexte applicatif. On trouvera une revue de detail des differentes
methodes dans larticle de synth`ese de Jain et al [51] qui insistent en outre sur limportance de la phase dextraction des caracteristiques qui prec`ede la reconnaissance de formes
elle-meme et montrent linteret de combiner plusieurs classifieurs.

Approche neuronale
Il sagit de methodes inspirees des structures neuronales et du fonctionnement cerebral,
do`
u le nom frequent de reseau de neurones artificiels [52].
Le reseau neuronal est un programme qui met en jeu des neurones relies entre eux par
des connexions. Chaque neurone realise la sommation des stimuli des neurones afferents,
chaque connexion etant affectee dune ponderation. Cette sommation obeit `a differentes
formes de fonctions, dites de transfert ou dactivation (tout ou rien, fonction en escalier,

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

22

sigmode. . . ), et si le resultat depasse un certain seuil dactivation, alors le neurone envoie


un stimulus aux neurones afferents.

Approche statistique
Lapproche statistique [53] concerne essentiellement les methodes de regression ou
de classement multidimensionnelles qui permettent dexpliquer la valeur dune reponse ou
lappartenance `a un groupe en fonction des valeurs de plusieurs variables dites explicatives.
Il sagit notamment de lanalyse discriminante, de la regression logistique dans le cas
dune reponse qualitative, de la regression multiple dans le cas dune reponse quantitative,
ou du mod`ele de Cox dans le cas dune variable de reponse censuree (analyse de survie).
Ces methodes repondent `a deux objectifs : reduire le nombre souvent considerable de
variables potentiellement explicatives `a un sous-ensemble dusage et obtenir dune mani`ere
plus aisee une equation predictive.
Etant probablement la methode statistique de classement la plus utilisee, lanalyse
discriminante lineaire est une methode de reconnaissance de formes statistique basee sur
une technique dapprentissage supervise, tr`es facile `a mettre en uvre [54]. Le but est
de determiner la classe dune observation en calculant la distance de Mahalanobis entre
lobservation et le centre de chacune des classes et en affectant lobservation `a la classe
pour laquelle la distance de Mahalanobis est minimale.
Le mod`ele est etabli `a partir dun un ensemble dobservations (ensemble dapprentis` partir de cet ensemble dapprentissage,
sage) pour lesquelles les classes sont connues. A
lanalyse discriminante etablit un ensemble de fonctions lineaires des facteurs predictifs,
connues sous le nom de fonctions discriminantes, du type :

Y = v1 X1 + v2 X2 + . . . + vn Xn + C

(1.1)

o`
u les vi sont des coefficients discriminants, les xi sont les variables dentree (les facteurs
predictifs) et le C est une constante.
Ces fonctions discriminantes sont employees pour prevoir la classe dune nouvelle observation. Pour un probl`eme de classement avec k classes, k fonctions discriminantes sont
construites. Etant donnee une nouvelle observation, toutes les fonctions discriminantes
sont evaluees et lobservation est assignee `a la classe i si la i`eme fonction discriminante a
la valeur la plus elevee.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

23

Approche probabiliste
Lapproche probabiliste, reposant sur lapplication du theor`eme de Bayes, permet de
calculer la probabilite dune maladie connaissant les signes du malade. Lapplication sur
un probl`eme de diagnostic medical du theor`eme de Bayes etablit que la probabilite a
posteriori dun diagnostic Di , lorsque le signe S est present, est fonction de la probabilite
a priori du diagnostic et de la probabilite conditionnelle dobserver le signe lorsque le
diagnostic est present :
P (Di /S) =

P (Di ) P (S/Di )
P (Di ) P (S/Di )
= P
P (S)
( j P (Dj )P (S/Dj ))

(1.2)

La methode bayesienne tient compte des signes positifs et negatifs et permet de calculer
le diagnostic le plus probable [55]. La determination des probabilites a priori (incidence
de la maladie) et des probabilites conditionnelles (frequence dun signe dans une maladie) suppose lexploitation dune base de donnees medicales enregistrant les signes et le
diagnostic de chaque cas.

Approche symbolique
Il sagit essentiellement des syst`emes dits experts [56] qui sont des logiciels de
resolution de probl`emes, qui permettent de representer sous forme explicite et declarative
les connaissances et le comportement dun expert humain, afin quil puisse etre reproduit
par un programme. Les limites de cette approche tiennent aux contraintes de formulation
de la connaissance (connaissance imparfaite, relations multiples, difficulte de formalisation
du raisonnement, contrainte du dialogue avec lutilisateur, necessite de consensus).

1.4.4

Conclusion

Laide `a la decision est une discipline qui a suscite beaucoup dinteret au cours des
derni`eres decennies et enormement de methodes ont dej`a vu le jour. Cependant, aucune
methode ne sest imposee comme etant la methode de reference et la tendance au cours
de ces derni`eres annees fut lessor des syst`emes hybrides o`
u les resultats de plusieurs
methodes daide `a la decision sont combines. En effet, `a linstar des syst`emes multi-experts
o`
u la combinaison des interpretations de plusieurs experts est plus performante que celle
de chacun des experts pris individuellement [25], la combinaison des resultats de plusieurs
classifieurs (comites de reseaux de neurones) conduit `a des resultats de meilleure qualite
que ceux du meilleur classifieur (meilleur reseau de neurones du comite) [57]. De meme,
la combinaison des resultats de plusieurs methodes de classement (fusion de donnees
via des heuristiques entre un comite de reseaux de neurones et un reseau bayesien) sera
probablement plus performante que nimporte quelle methode consideree individuellement

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide `a la decision

24

[58]. Cest ce concept que nous allons developper dans le prochain chapitre : Aide `a la
decision en telecardiologie.

Troisi`
eme partie
Conception, validation et strat
egies
de d
eploiement de la plateforme
d
ecisionnelle dEPI-MEDICS

25

Chapitre 2
Aide `
a la d
ecision en t
el
ecardiologie
2.1

Contexte et objectifs

Comme dej`a indique dans lintroduction de ce memoire, lobjectif principal dEPIMEDICS est de permettre la detection precoce de linfarctus du myocarde d`es lapparition des premiers symptomes afin de pouvoir intervenir rapidement et administrer un
traitement immediat et efficace.
Dans ce contexte, lECG, grace `a son caract`ere non-invasif, sa rapidite de mise en
uvre, et son faible co
ut reste un examen objectif de choix. Cependant, comme evoque
dans le chapitre 1, sa performance diagnostique reste limitee. Ainsi Pope et al [18] ont
montre quen pratique clinique lorsque lon applique les crit`eres ECG classiques de diagnostic de linfarctus, au moins 25% des patients qui avaient un infarctus du myocarde
ne sont pas diagnostiques et sont renvoyes de lhopital sans traitement. Sans doute de
nouvelles methodes de reconnaissance de forme combinees `a de nouvelles methodes de
traitement du signal (analyse en ondelettes, etc.) pourront elles permettre dameliorer
ces performances. Les resultats de laction CSE ont montre en effet que les meilleurs
programmes danalyse automatique de lECG sont aussi performants que les meilleurs
cardiologues [25]. Mais il faut savoir aussi que la performance des cardiologues est accrue
lorsquils connaissent le contexte du patient. En effet, de nombreuses etudes [59, 60, 61, 62]
ont montre que lanalyse de lECG combinee avec lhistorique clinique et les resultats des
derni`eres analyses medicales du patient est le meilleur moyen pour effectuer un diagnostic precoce de linfarctus du myocarde, en particulier dans un contexte durgence ou en
ambulatoire.
La principale problematique est donc de pouvoir trouver la meilleure solution pour
fusionner des donnees de nature differente (dichotomique, categorique et continue), en
provenance de sources diverses (ECG, donnees cliniques,. . . ) afin detablir un score de
risque et declencher une alarme appropriee. Or ce domaine de la fusion de donnees est
devenu particuli`erement important pour un grand nombre dapplications tels que la ro-

Chapitre 2. Aide `a la decision en telecardiologie

27

botique, linterpretation dimage ou dans notre contexte, la telemedecine. De nombreuses


approches ont ete developpees afin dassurer une combinaison optimale des donnees. Aussi
Jeanpierre et al. [63] et Bellot et al. [64] ont developpe une approche de fusion de donnees
dans le cadre dune application de telemedecine. Il sagit du projet Diatelic qui a pour
objectif dassister `a domicile des personnes souffrant dinsuffisance renale `a travers un
recueil regulier de donnees aupr`es patient (poids, tension, temperature,. . . ) `a laide de
capteurs. Ces donnees, heterog`enes, incertaines et bruitees sont fusionnees au sein dun
reseau bayesien dynamique afin de pouvoir etablir un diagnostic. Enfin, pour passer dune
mesure absolue (poids du patient) `a une mesure relative prenant en compte la specificite
du patient, on fait appel `a des operateurs de logique floue.
Mettre au point de nouvelles methodes de fusion de donnees dans le domaine de
la telecardiologie impose que lon puisse disposer de bases de donnees encapsulant pour
chaque patient `a la fois des ECG, des donnees cliniques et son historique medical recueillis
de facon synchrone. Malheureusement, il nexiste pas encore de telles bases de donnees
contenant un nombre significatif de cas. A linverse, il existe un certain nombre de bases de
donnees collectees sur differentes populations de patients mais comportant soit des ECG,
soit des donnees cliniques. En labsence de bases de donnees synchrones bien documentees,
lalternative est donc :
dexploiter separement les bases de donnees ECG et les bases de donnees cliniques,
de developper separement des modules dinterpretation de lECG et de stratification
des facteurs de risque,
enfin de concevoir des scenarios de collaboration entre ces differents modules.
Cest cette approche que nous allons developper tout au long de ce chapitre en
presentant tout dabord une methode dinterpretation automatique de lECG mettant
en uvre des comites de reseaux de neurones artificiels optimises pour diagnostiquer
les infarctus aigues, puis une methode visant `a quantifier limportance du risque cardiovasculaire au moyen dun reseau bayesien. Enfin nous proposons un mod`ele de diagnostic
cardiologique global combinant les resultats de linterpretation de lECG et de levaluation
des facteurs de risque.

2.2

Interpr
etation automatique de lECG

Il existe de par le monde plusieurs dizaines, voire plusieurs centaines de programmes


dinterpretation automatique de lECG. La plupart sont bases sur une approche heuristique ou melangent approche heuristique et approche statistique. En effet, peu de programmes bases sur une approche statistique pure ou sur des reseaux de neurones ont recu
une acceptabilite suffisante du corps medical qui exige generalement quun programme
dinterpretation automatique de lECG justifie, en termes medicaux comprehensibles par
lensemble des professionnels de sante, les raisons de la decision.
Le contexte dapplication dun tel module dans le cadre du projet EPI-MEDICS est

Chapitre 2. Aide `a la decision en telecardiologie

28

tout autre car ici lon cherche avant tout `a privilegier la performance de la detection
dune ischemie ou dun infarctus aigue en minimisant le nombre de faux positifs et de
faux negatifs sachant que par ailleurs lon envoie lECG au cardiologue pour quil puisse
controler sil le juge utile la qualite de linterpretation. Dans ce contexte, lutilisation de
comites de reseaux de neurones artificiels parat extremement pertinente. Les reseaux de
neurones en effet constituent un paradigme informatique de reconnaissance de formes qui
sest avere tr`es prometteur pour resoudre des applications de medecine en general [65] et
plus particuli`erement le diagnostic de linfarctus. De nombreuses etudes ont demontre la
qualite de linterpretation automatique de lECG par reseaux de neurones dans le cadre
dun scenario de diagnostic de linfarctus du myocarde. Parmi ces etudes, il convient de
citer plus particuli`erement Baxt [66] et Harrison et al. [67] qui ont utilise lhistorique
medical du patient ainsi que des donnees dECG et des donnees cliniques comme entrees
du reseau de neurones. Des etudes plus recentes [68, 69] ont utilise les reseaux de neurones
dans le but de faire un outil daide `a la decision dedie aux services durgence. Utilisant
uniquement lECG 12D comme donnees dentree au reseau de neurones, Heden et al. [70]
pouvaient detecter linfarctus avec un taux de reussite egal voire meilleur qu`a celui dun
cardiologue experimente. Une autre etude [22] a montre linteret dutiliser des param`etres
seriels de lECG pour diagnostiquer linfarctus.
Dans le reste de cette section, nous allons presenter les reseaux de neurones, les
mecanismes dapprentissage ainsi que les techniques doptimisation, en particulier lapproche multi-expert par des comites de reseaux de neurones. Ensuite, nous allons presenter
les methodes statistiques utilisees comme temoin de comparaison avec les reseaux de neurones : lanalyse discriminante. Enfin, nous presentons les evaluations effectuees sur une
base de donnees ECG, la base de donnees de Lund, par rapport `a lanalyse discriminante
et deux experts humains : un cardiologue experimente et un medecin interne.

2.2.1

Les r
eseaux de neurones

D
efinition
Les reseaux de neurones artificiels sont des mod`eles de calcul dont la conception est
tr`es schematiquement inspiree du fonctionnement cerebral et des structures neuronales.
Ils sont generalement optimises par des methodes dapprentissage de type statistique qui
leur permettent de prendre des decisions sappuyant davantage sur la perception que sur
le raisonnement logique formel [71].

Couches, connexions et fonctions dactivation


Un reseau de neurones est ainsi constitue de neurones connectes par des liaisons qui
permettent `a chaque neurone denvoyer et recevoir des signaux en provenance des neurones

Chapitre 2. Aide `a la decision en telecardiologie

29

qui le prec`edent. Chacune de ces connexions recoit une ponderation qui determine son
impact sur les neurones quelle connecte. Chaque neurone dispose ainsi dune entree,
qui lui permet de recevoir de linformation dautres neurones, mais aussi dune fonction
dactivation, qui est dans les cas les plus simples, une simple fonction identite du resultat
obtenu par lentree, et enfin une sortie (Figure 2.1).

Fig. 2.1 Fonctionnement des neurones : chaque neurone m additionne les valeurs de ses
entrees (n1 , n2 , n3 ) multipliees par des poids (W1 , W2 , W3 ), passe le resultat dans une
fonction dactivation, et le renvoie aux neurones qui le suivent.
Le choix dune fonction dactivation se rev`ele etre un element constitutif important
des reseaux de neurones. Le plus souvent des fonctions non lineaires seront necessaires.
Les fonctions couramment utilisees comme fonctions dactivation sont (Figure 2.2) :
La fonction logistique :
1
(2.1)
Y = F (X) =
(1 + e(dX) )
La fonction tangente hyperbolique :
Y =

2
1
(1 + e(2X) )

(2.2)

Les fonctions `a seuil telles que :


0 si X < 0
Y = 1 si X > 0

(2.3)

Types de r
eseaux
Les reseaux de neurones ont suscite beaucoup dinteret au cours des derni`eres decennies
et enormement de variantes ont dej`a vu le jour : les perceptrons multi-couches [72], les
reseaux de Kohonen [73, 74], les reseaux de Hopfield [75], etc.

Les perceptrons multi-couches Lexemple de reseau de neurones le plus utilise reste


le perceptron multi-couches (Figure 2.3). Dans un perceptron, les neurones sont organises
suivant une couche dentree, une couche de sortie, et une ou plusieurs couches cachees qui
assurent la connexion entre lentree et la sortie du reseau :

Chapitre 2. Aide `a la decision en telecardiologie

(a) La fonction logistique.

30

(b) La fonction tangente hyperbolique.

(c) La fonction `a seuil.

Fig. 2.2 Exemples de fonctions dactivation.

La couche dentree recoit les donnees sources que lon veut utiliser pour lanalyse.
Dans le cas de laide au diagnostic medical, cette couche recevra les symptomes. Sa
taille est donc directement determinee par le nombre de variables dentrees.
La couche de sortie donne le resultat obtenu. Dans le cas de laide au diagnostic
medical, cette couche donne le diagnostic sous forme dune probabilite entre 0 (sujet
sain), et 1 (diagnostic confirme). Sa taille est directement determinee par le nombre
de variables (ou diagnostic) quon veut en sortie.
La couche intermediaire est dite cachee dans le sens quelle na quune utilite intrins`eque pour le reseau de neurones et na pas de contact direct avec lexterieur.
Le principe de fonctionnement est le suivant : nous disposons initialement dune base
de connaissances constituee de couples de donnees entrees / sorties (symptomes, signes
cliniques / pathologie) et nous souhaitons utiliser cette base de donnees pour configurer
et entraner le reseau de neurones, grace `a un algorithme informatique, `a reproduire les
associations constatees entre les entrees et les sorties de la base de connaissances.
Les fonctions dactivation de la couche cachee sont en general non lineaires mais il ny
a pas de r`egle `a respecter. Le choix du nombre de couches cachees et de leur taille nest pas
implicite et doit etre ajuste. En general, plusieurs tests sont necessaires. On commence
par exemple par prendre une moyenne du nombre de neurones des couches dentree et de
sortie, mais ce nest pas toujours le meilleur choix. Il est donc souvent necessaire, pour
obtenir de bons resultats, dessayer le plus de tailles possibles.

Chapitre 2. Aide `a la decision en telecardiologie

31

Fig. 2.3 Illustration dun reseau de neurones de type perceptron multi-couches.


Les
etapes de conception dun r
eseau de neurones
Choix et pr
eparation des
echantillons Le processus delaboration dun reseau de
neurones commence par le choix et la preparation des echantillons de donnees. En general
une partie de lensemble de donnees est simplement ecarte de lechantillon dapprentissage
et conserve pour les tests hors echantillon afin de verifier la capacite de generalisation du
reseau.

Elaboration de la structure du r
eseau La structure du reseau depend etroitement
du type de reseau : un perceptron standard, un reseau de Hopfield, un reseau de Kohonen,
etc. Ensuite en fonction du type choisi, lelaboration de la structure du reseau peut varier :
dans le cas du perceptron, il faudra aussi determiner le nombre de neurones dans la couche
cachee.

Apprentissage Lapprentissage consiste `a calculer les ponderations optimales des


differentes liaisons du reseau de neurones, en utilisant un echantillon de donnees (par
exemple une base de donnees ECG, o`
u les param`etres de lECG alimentent lentree du
reseau et le diagnostic medecin de lECG sert comme verite clinique et sera compare par
rapport `a la sortie du reseau). Lapprentissage peut se faire de differentes mani`eres :
Le mode supervise : dans ce type dapprentissage, le reseau sadapte par comparaison entre le resultat quil a calcule, en fonction des entrees fournies, et la reponse
attendue en sortie. Ainsi, le reseau va se modifier jusqu`a ce quil trouve la bonne
sortie, cest-`a-dire celle attendue, correspondant `a une entree donnee.
Le mode non-supervise : Dans ce cas, lapprentissage travaille sur un ensemble de
donnees sans information prealable sur le nombre de classes et sur la classe des
echantillons. Il est generalement base sur des probabilites. Le reseau va se modifier
en fonction des regularites statistiques de lentree et etablir des categories, en attribuant et en optimisant un crit`ere dappartenance aux categories identifiees par

Chapitre 2. Aide `a la decision en telecardiologie

32

lapprentissage.
Par la suite, dans le cadre de notre application, du fait que nous disposons de la verite sur
la sortie du reseau, nous nous interesserons surtout `a lapprentissage supervise que nous
allons detailler ci-apr`es.

Apprentissage par r
etropropagation La methode dapprentissage supervise la plus
utilisee est la retropropagation [76]. Le principe de la retropropagation consiste `a alimenter
le reseau de neurones par les donnees de lensemble dapprentissage, et en fonction de
lerreur obtenue en sortie par rapport `a la verite (sortie de lensemble), nous corrigeons
les poids accordes aux neurones.
On montre chaque exemple au reseau de neurones, puis on propage ces valeurs
vers la sortie. La prediction que lon obtient en sortie est au debut erronee.
On calcule la valeur de lerreur (cest `a dire la difference entre les valeurs desirees
et les valeurs predites), puis on retropropage cette erreur en remontant le reseau
et en modifiant les poids proportionnellement `a la contribution de chacun `a lerreur
totale.
On rep`ete ce mecanisme pour chaque exemple de donnees et tant que le taux de
reclassement sur les donnees sameliore.
Il faut bien prendre garde cependant de ne pas surentraner un reseau de neurones en lui
faisant apprendre par coeur car il deviendrait alors moins performant. Il existe diverses
techniques qui permettent deviter de tomber dans le phenom`ene de sur-apprentissage
telles que la validation croisee (cross-validation), et larret precoce (early stopping) :
Larret precoce consiste `a diviser lensemble dapprentissage en deux sous-ensembles.
Le premier sous-ensemble sert `a entraner le reseau. Le deuxi`eme sous-ensemble, dit
de validation, joue le role darbitre de telle sorte que le cycle dapprentissage est
repete tant que lerreur obtenue en sortie sur les donnees de lensemble de validation
est decroissante.
La validation croisee consiste `a diviser lensemble dapprentissage en N (par exemple
5) sous-ensembles egaux et disjoints. Lapprentissage est ensuite effectue sur les
N 1 sous-ensembles et lerreur (ei ) est calculee sur le sous-ensemble restant, servant de validation. La procedure est repetee N fois, en choisissant `a chaque fois un
sous-ensemble de validation different. Enfin, un taux derreur moyen (E) est calcule et lapprentissage est refait en utilisant cette fois la totalite de lensemble de
donnees avec comme condition darret lerreur moyenne (E) calculee lors de letape
precedente (tableau 2.1)
Techniques doptimisation
Les reseaux de neurones, dans leur structure meme, permettent de nombreuses
ameliorations : choix du nombre de couches cachees, du nombre de neurones dans les
couches cachees, du type de fonctions dactivation, etc. Mais la technique la plus pertinente semble etre la combinaison de differents classifieurs pour former ce que dans la

Chapitre 2. Aide `a la decision en telecardiologie

33

Tab. 2.1 Exemple de validation croisee pour N=5. Lensemble des donnees dapprentissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. Lapprentissage est ensuite
effectue sur les N 1 sous-ensembles s2 `a S5 et lerreur est calculee sur le sous-ensemble
restant s1, servant de validation. Cette operation est reiteree quatre fois en choisissant
chaque fois un ensemble de validation different. Enfin, un taux derreur moyen est calcule
et lapprentissage est refait en utilisant la totalite de lensemble de donnees.
S
erie dapprentissage
s2 s3 s4 s5
s1 s3 s4 s5
s1 s2 s4 s5
s1 s2 s3 s5
s1 s2 s3 s4

Validation
s1
s2
s3
s4
s5

litterature on qualifie de comites ou ensembles de reseaux de neurones. Lobjectif est


dameliorer la capacite de generalisation en combinant plusieurs reseaux individuels entranes `a effectuer la meme tache, ce qui produit une performance largement superieure
`a celle obtenue par chaque reseau individuel. Linteret et lefficacite de lapproche ensembliste pour ameliorer la performance des reseaux de neurones ont dej`a ete justifies `a la
fois theoriquement [77, 78] et empiriquement [79].
La creation dun comite de reseaux de neurones est souvent divisee en deux etapes [80].
La premi`ere est la creation des reseaux individuels composants le comite et la seconde est
la combinaison appropriee de ces reseaux pour produire la sortie du comite. La facon et
limpact de combiner les sorties individuelles ont ete etudie dans [78]. Dans cet article,
on a montre que lerreur quadratique realisee par le comite, lorsquil sagit de realiser
une prediction unique, est egale `a lerreur quadratique moyenne des reseaux individuels
diminuee de la diversite, definie comme etant la variance des sorties des reseaux individuels. Cest la raison pour laquelle, pour reduire lerreur sur le comite, il faut augmenter
la diversite, sans trop augmenter les erreurs des reseaux individuels.
La methode la plus simple pour creer des comites de reseaux de neurones est dentraner, sur un meme ensemble dapprentissage, une selection de reseaux individuels choisis
avec un parametrage aleatoire initial des poids. Comme linitialisation des poids est faite
aleatoirement au debut, les reseaux evoluent differemment dans la phase dapprentissage et
donnent donc des resultats sensiblement differents. Une approche plus elaboree consiste
`a entraner chacun des reseaux du comite sur un sous-ensemble different de lensemble
dapprentissage initial. Les variantes de cette approche sont diverses. Dans la technique
du Bagging [81], chaque sous-ensemble dapprentissage est tire uniformement, avec remise, de lensemble initial. La prediction finale est basee sur la sortie des divers reseaux du
comite : moyenne des sorties, vote majoritaire des classifieurs, etc. Le Boosting [82] utilise
aussi le tirage avec remise, mais les echantillons sont construits de facon `a favoriser le tirage
des exemples consideres comme difficiles `a classer par le reseau precedent. La prediction fi-

Chapitre 2. Aide `a la decision en telecardiologie

34

nale est une combinaison (vote pondere) des diverses predictions. Une troisi`eme approche
consiste `a realiser une selection ciblee (`a la place dune simple selection aleatoire) du
parametrage initial des poids des reseaux [83, 84, 85]
Enfin, les performances des reseaux de neurones peuvent etre ameliorees an appliquant
un pre-traitement des donnees, tels que lanalyse en composantes principales (ACP).
LACP sur les donnees en entree du reseau permet en effet de ne garder que les caracteristiques importantes des donnees de depart et se concretise en general par un apprentissage plus efficace du reseau de neurones [22, 86].

2.2.2

Conception, r
ealisation et
evaluation du module dinterpr
etation de lECG par r
eseaux de neurones

Developper une nouvelle methode de reconnaissance de formes et en particulier un


nouveau module dinterpretation automatique de lECG necessite de pouvoir disposer
dun ensemble dapprentissage et de test consequent et de sassurer de la qualite et de
la robustesse des algorithmes developpes en effectuant des evaluations rigoureuses par
comparaison par rapport aux experts humains.
Grace aux cooperations instaurees par le projet EPI-MEDICS, nous avons eu la chance
de pouvoir acceder `a une base de donnees ECG serielles constituee par lequipe du Professeur Edenbrandt de lUniversite de Lund en Su`ede, dont la caracteristique majeure
est davoir ete collectee dans differents services durgence cardiologique des Hopitaux de
Lund dans le but de constituer une base de donnees de reference pour la mise au point
de syst`emes daide `a la decision pour la detection de linfarctus aigue. Bien que les ECG
aient ete collectes `a un stade devolution de lischemie qui est bien posterieur `a celui
survenant en ambulatoire ou au domicile des patients, nous pensons neanmoins que la
base de donnees de Lund est une base de donnees majeure, non pas pour optimiser les
processus de decision qui seront utilises dans le PEM et qui de toutes facons devront
etre specifiques aux patients, mais au moins pour valider les concepts et larchitecture des
reseaux de neurones qui nous allons presenter dans la suite de ce chapitre, juste apr`es une
br`eve description de la base de donnees de Lund.

Ensembles dapprentissage et de test


La base de donnees de Lund est composee dECG enregistres sur des patients qui se
sont presentes au service des urgences de lHopital Universitaire de Lund (Su`ede) entre
janvier 1990 et Juin 1997 [22]. Chaque ECG a ete classe dans lune des deux categories
suivantes :
1. AMI (Acute Myocardial Infarction), si lECG enregistre provenait dun patient pour
lequel le diagnostic dinfarctus a ete confirme lors de sa sortie de lunite des soins

Chapitre 2. Aide `a la decision en telecardiologie

35

coronariens avec un diagnostic dinfarctus.


2. Controle, si lECG enregistre provenait dun patient pour lequel le diagnostic
confirme etait un diagnostic autre que AMI.
Pour chaque ECG enregistre, un ECG precedent du meme patient a ete selectionne
dans la base de donnees de lhopital. Les ECG de la categorie AMI et leurs predecesseurs
ont ete regroupes dans le groupe AMI et les paires correspondant `a la categorie controle
ont ete assignees au groupe de controle.
Le diagnostic dAMI a ete etabli si au moins 2 des 3 crit`eres suivants ont ete confirmes :
une douleur thoracique caracteristique durant au moins 20 min, un niveau eleve de creatine
kinase (CK), ou des changements electocardiographiques seriels caracteristiques. Des valeurs de creatine kinase-MB > 0.23 mkat/L ainsi quune augmentation et une diminution
typiques ont ete utilises pour diagnostiquer lAMI. Les marqueurs electrocardiographique
de lAMI sont : une apparition dune onde Q dans au moins 2 derivations contigues et/ou
une inversion de londe T presente dans au moins 2 derivations contigues apr`es un susdecalage du segment ST dans ces derivations. Enfin, un cardiologue experimente a valide
chaque diagnostic.
Les ECG ont ete recueillis par un electrocardiographe 12 derivations et echantillonnes
`a une frequence de 1000 Herz. Pour chaque ECG, on dispose dun complexe median PQRS-T dune duree de 1 sec representatif de lenregistrement de 10 sec dorigine. La
population detude consiste en un total de 4691 paires dECG. Le groupe final dAMI est
compose de 902 paires dECG (546 hommes et 356 femmes, age : m = 74 11 ans)
et le groupe final de controle de 3789 paires dECG (1954 hommes et 1835 femmes, age :
m = 70 15 ans).

Interpr
etation des ECG par des experts humains
Chaque ECG durgence de la base de donnees de Lund a ete interprete de mani`ere
independante par un cardiologue experimente et par un medecin interne, dabord en ne
tenant compte que du seul ECG enregistre dans le service durgence, puis en tenant
compte de lECG de reference. Les ECG ont ete classes dans les categories suivantes :
1. D1 : Infarctus confirme.
2. D2 : Infarctus probable.
3. D3 : Infarctus peu probable.
4. D4 : pas dinfarctus.
Ces diagnostics ont ete etablis en nayant aucune autre information `a leur disposition que
les ECG et les dates dacquisition des deux ECG (analyse serielle).

Chapitre 2. Aide `a la decision en telecardiologie

36

M
ethodes
En situation durgence et egalement dans le cadre de lutilisation du PEM, deux situations peuvent se produire. Soit lon dispose dun ECG de reference : dans ce cas il vaut
mieux realiser une analyse serielle. Soit lon ne dispose pas dun ECG de reference car inexistant ou lon narrive pas `a le retrouver faute dun syst`eme dinformation performant :
dans ce cas il faudra se contenter dun programme danalyse unaire. Cest exactement
cette demarche que nous avons suivie en developpant deux versions du programme dinterpretation automatique des ECG toutes les deux basees sur des comites de reseaux de
neurones de type perceptron multicouches (PMC), lun de type unaire que nous tenterons
sur les enregistrements effectues en urgence, lautre de type serielle prenant en compte les
param`etres de lECG reference pour etablir le diagnostic des ECG enregistres en urgence.
La premi`ere etape a ete de constituer deux ensembles dapprentissage et de test
independants. Lensemble de test a ete forme en tirant 988 cas au hasard sur la totalite de la base de donnees de Lund (199 cas dAMI et 789 cas de controle). Lensemble
dapprentissage est compose du reste des 3703 cas (soit 703 cas dAMI et 3000 cas de
controle).
La deuxi`eme etape vise `a reduire la quantite de donnees. En effet, un programme
danalyse automatique des ECG calcule en moyenne 500 `a 1000 descripteurs. Dans notre
cas nous disposons pour chaque enregistrement : ECG de reference et ECG durgence, de
(1112)= 132 param`etres choisis pour leur pertinence eu egard `a la detection des AMI
[8]. Ils correspondant `a 11 mesures caracteristiques des ondes QRS et T sur chacune des
12 derivations : duree de QRS ; aire de QRS ; amplitudes de Q, R, et S ; et 6 mesures de
ST-T : (amplitude de ST-J, pente de ST, amplitude de ST 2/8, amplitude de ST 3/8,
amplitude de T positive et amplitude de T negative).
Pour lensemble des ECG durgence, nous effectuons une analyse en composantes principales (ACP), afin de reduire le nombre de variables. A lissue de lACP, 16 variables sont
conservees : elles correspondent `a la duree de QRS, laire de QRS, les amplitudes des ondes
Q, R et S, les amplitudes de ST et la duree de londe T. Ces 16 variables constitueront
notre premier jeu de donnees et seront utilisees pour lanalyse unaire.
Pour permettre lanalyse serielle, une nouvelle analyse en composantes principales est
effectuee sur la difference entre les 132 param`etres des ECG courants et ceux des ECG de
reference. 16 nouveaux param`etres correspondant `a levolution de la duree de QRS, laire
de QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la duree de londe
T entre ECG courants et ECG de reference, sont extraits, et, ajoutes aux 16 param`etres
decrits ci-dessus, les 32 param`etres formeront le deuxi`eme jeu de donnees.
Ces deux jeux de donnees sont ensuite utilises pour configurer deux comites de reseaux
de neurones : le premier pour les param`etres unaires et le deuxi`eme pour les param`etres
seriels. Les performances obtenues par les deux comites de reseaux de neurones sont enfin
compares par rapport aux resultats dune analyse discriminante effectuee en utilisant les

Chapitre 2. Aide `a la decision en telecardiologie

37

memes ensembles dapprentissage et de test que pour les reseaux de neurones et ceux
obtenus par linterpretation realisee par deux experts : un cardiologue experimente et
un medecin interne. Enfin, pour realiser notre mod`ele de reseaux de neurones, ainsi que
tous les tests devaluation, nous avons utilise MatlabTM et sa bote `a outils reseaux de
neurones. Lanalyse discriminante a ete realisee avec le logiciel XLSTATTM .

R
ealisation du mod`
ele de r
eseaux de neurones Plusieurs param`etres sont `a
determiner au niveau de larchitecture des reseaux : nombre de neurones sur la couche
cachee, fonctions dactivation pour le passage dune couche `a lautre, algorithme utilise
en apprentissage, etc.

Choix de lalgorithme dapprentissage Pour les perceptrons multicouches


(PMC), Matlab dispose de la version basique de lalgorithme de retropropagation,
mais egalement dune variete dalgorithmes dapprentissage bases sur le principe de
retropropagation qui varient en co
ut de calcul et vitesse de convergence : les algorithmes
de la famille quasi-Newton, ceux bases sur la descente du gradient conjugue, etc. Certains
de ces algorithmes sont adaptes `a des taches de classement alors que dautres sont plus
performants dans lapproximation de fonctions.
Parmi ces algorithmes, la methode de Levenberg-Marquardt [87, 88] est devenue un
standard pour loptimisation de lerreur quadratique `a cause de ses proprietes de convergence rapide et de robustesse. De meme, Levenberg-Marquardt est un algorithme tr`es
puissant doptimisation non-lineaire ce qui la fait adopter pour de nombreuses taches de
classement dans divers domaines [89, 90, 91, 92].
Pour notre application, nous avons donc decide dutiliser lalgorithme de LevenbergMarquardt. Enfin, pour eviter le sur-apprentissage, nous avons utilise la methode darret
precoce (early stopping), dej`a decrite dans la section 2.2.1.

Choix des fonctions dactivation Le choix de la retro-propagation pour lapprentissage du reseau impose des fonctions derivables. Les fonctions sigmodes comme
la fonction tangente-sigmode, la fonction logarithme-sigmode ou la fonction gaussienne
sont les fonctions usuellement utilisees pour les neurones des couches cachees. Dans notre
situation, nous souhaitons avoir en sortie du reseau des valeurs comprises entre 0 et 1,
o`
u un 1 correspond `a la categorie AMI et 0 signifie que le cas appartient `a lensemble
de controle. Nous avons donc choisi dutiliser des fonctions logarithme-sigmode `a la fois
pour la couche cachee et celle de sortie.

Choix de larchitecture neuronale Il sagit de fixer le nombre de couches cachees


ainsi que le nombre de neurones dans chaque couche. Le choix dune seule couche cachee
nous a semble etre un bon compromis entre la complexite (et donc le temps de calcul)

Chapitre 2. Aide `a la decision en telecardiologie

38

et la performance du reseau. Reste encore le probl`eme du nombre de neurones qui la


composent. Il ny a pas de r`egles ou de lois en la mati`ere, et ce nombre se determine
souvent empiriquement. Cest un travail long et fastidieux qui necessite de nombreuses
experimentations. Notre objectif etant dans un premier temps devaluer la robustesse des
reseaux de neurones, nous avons utilise la configuration utilisee dans [22], `a savoir 10
neurones sur la couche cachee pour lanalyse unaire (jeu de donnees de 16 variables) et 15
neurones pour lanalyse serielle (jeu de donnees de 32 variables). Le nombre de neurones
en entree sera egal au nombre de param`etres du jeu de donnees, et la couche de sortie sera
composee dun seul neurone, indiquant si le patient fait partie de la classe des AMI ou de
la classe de controle. Enfin, notre methode se diff`ere sur plusieurs points de la methode
adoptee par Ohlson et al [22] :
Un param`etrage de reseaux de neurones differents (au niveau de la fonction dactivation des neurones de la couche cachee).
Une difference au niveau de lapprentissage (version basique vs. la variante
Levenberg-Marquardt de lalgorithme de retropropagation).
Une politique differente pour eviter le surapprentissage (arret precoce vs. validation
croisee).
La figure 2.4 illustre le fonctionnement du comite de reseaux de neurones
unaires/seriels. Ce comite recoit les 16/32 param`etres unaires/seriels et etablit un score
de risque compris entre 0 et 1. Dans le cadre dEPI-MEDICS 4 niveaux de risque ont ete
defini :
pas de risque : si le score de risque est compris entre 0 et 0.125.
risque mineur : si le score de risque est compris entre 0.125 et 0.25.
risque moyen : si le score de risque est compris entre 0.25 et 0.45.
risque majeur : si le score de risque est superieur `a 0.45.

Chapitre 2. Aide `a la decision en telecardiologie

39

Fig. 2.4 Illustration du fonctionnement du comite de reseaux de neurones unaires/seriels


utilise pour linterpretation de lECG.

Chapitre 2. Aide `a la decision en telecardiologie

40

Tests d
evaluation - Courbes ROC
Quatre situations sont habituellement issues de levaluation dune methode de reconnaissance de formes (comites de reseaux de neurones ou analyse discriminante) dichotomique (2 classes) sur un echantillon de test. En effet, le resultat de laffectation
peut etre positif ou negatif, et la pathologie est presente (vrai) ou absente (faux). Deux
interpretations des resultats du classifieur sont correctes (vrai positif et vrai negatif).
Deux sont fausses (faux positif et faux negatif). Ces quatre situations peuvent donc etre
representees sous la forme dune matrice de confusion 2 2.
Tab. 2.2 Matrice de confusion.
R
esultats de la machine
Classement
positif
Classement
negatif

V
erit
e
Maladie presente Maladie absente
vrai positif
faux positif
a
b
faux negatif
vrai negatif
c
d

Les param`etres issus de la matrice de confusion permettent de calculer quatre ratios


indicateurs de la qualite de la methode de classement :
sensibilite : pourcentage davoir une interpretation positive quand la pathologie est
presente : a / (a + c)
specificite : pourcentage davoir une interpretation negative quand il ny a pas de
pathologie : d / (b + d) ;
valeur predictive positive : pourcentage davoir un cas presentant la pathologie quand
linterpretation est positive : a / (a + b) ;
valeur predictive negative : pourcentage davoir un cas ne presentant pas la pathologie quand linterpretation est negative : d / (c + d).
La performance en % de bien classes de la methode de classement est definie par la
ratio suivant : (a+d)/(a+b+c+d).
Les matrices de confusion sont obtenues en fixant un seuil de risque au del`a duquel le
diagnostic etabli par la methode de classement pour le cas en question est juge comme
pathologique. Pour chaque seuil, une matrice de confusion, et donc les specificites et
sensibilites associees, sont calculees.
Pour chacune des deux methodes de classement (reseaux de neurones et analyse discriminante), nous utilisons les specificites et sensibilites associees `a chaque seuil pour
ensuite tracer la courbe ROC (Receiver Operator Characteristic curve) associee. Cette
derni`ere represente la sensibilite en fonction de (1-specificite). Elle permet de regler la
capacite diagnostique des tests, en permettant au chercheur deffectuer le compromis souhaite entre specificite et sensibilite. Laire sous la courbe ROC sert comme indicateur de

Chapitre 2. Aide `a la decision en telecardiologie

41

la performance generale de la methode `a evaluer : plus cette aire est elevee, meilleure est
la methode (Figure 2.5).

Fig. 2.5 Comparaison du pouvoir discriminant de deux methodes de classement. Selon


ces deux traces de courbes ROC, la methode A est meilleure que la methode B.

R
esultats
Evaluation de linterpr
etation des experts humains Les experts humains, cardiologue et medecin interne, ont classe les 988 ECG durgence de lensemble de test en 4
categories (D1 : infarctus confirme, D2 : probable, D3 : peu probable, D4 : pas dinfarctus) en tenant compte dans un premier temps uniquement de lECG durgence (analyse
unaire), puis en tenant compte de lECG de reference (analyse serielle).
En analyse unaire, le cardiologue a classe 86 ECG dans la categorie D1 (infarctus
confirme), 371 ECG en D2 (infarctus probable), 391 ECG en D3 (infarctus peu probable)
et 140 ECG en D4 (pas dinfarctus). Le medecin interne a classe `a son tour 32 ECG en
D1, 171 ECG en D2, 688 ECG en D3 et 97 ECG en D4.
En analyse serielle, le cardiologue a classe 80 ECG dans la categorie D1 (infarctus
confirme), 282 ECG en D2 (infarctus probable), 483 ECG en D3 (infarctus peu probable)
et 143 ECG en D4 (pas dinfarctus). Le medecin interne a classe `a son tour 41 ECG en
D1, 174 ECG en D2, 455 ECG en D3 et 318 ECG en D4.
Le tableau 2.3 illustre les resultats de lanalyse unaire des deux experts par rapport
`a la verite clinique. De la meme facon, le tableau 2.4 illustre les resultats de lanalyse
serielle des deux experts.
` partir des ces resultats, nous avons calcule 3 paires de sensibilite/specificite D1
A
(infarctus confirme) contre D2+D3+D4(infarctus probable, peu probable ou pas dinfarctus considere comme controle) ; D1+D2 (infarctus confirme ou probable considere

Chapitre 2. Aide `a la decision en telecardiologie

42

comme infarctus) contre D3+D4 (infarctus peu probable ou pas dinfarctus considere
comme controle) ; D1+D2+D3 (Infarctus confirme, probable ou peu probable considere
comme infarctus) contre D4 (pas dinfarctus considere comme controle) par analyse
(unaire/serielle), et nous avons utilise pour construire deux courbes ROC par expert
(cardiologue/interne, figures 2.8(c) et 2.8(d)).
Pour lanalyse unaire, le cardiologue realise une sensibilite de 34% et une specificite
de 97% pour D1 contre D2+D3+D4 ; 83% et 63% pour D1+D2 contre D3+D4 ; 97% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 13% et une
specificite de 99% pour D1 contre D2+D3+D4 ; 50% et 86% pour D1+D2 contre D3+D4 ;
97% et 11% pour D1+D2+D3 contre D4.
Pour lanalyse serielle, le cardiologue realise une sensibilite de 34% et une specificite
de 98% pour D1 contre D2+D3+D4 ; 78% et 73% pour D1+D2 contre D3+D4 ; 96% et
17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 15% et une
specificite de 98% pour D1 contre D2+D3+D4 ; 56% et 87% pour D1+D2 contre D3+D4 ;
92% et 38% pour D1+D2+D3 contre D4.
Tab. 2.3 Resultats de linterpretation en 4 categories (D1, D2, D3, D4) des ECG durgence de lensemble de test, effectuee par les deux experts, en fonction de la verite clinique
(199 cas dinfarctus (AMI) et 789 cas de controle). Ce tableau illustre les resultats de linterpretation unaire effectuee sur les ECG durgence sans avoir eu connaissance des ECG
de reference des patients.
Cardiologue
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)

D2+D3+D4
772
130
97

D1
17
69
34
-

D3+D4
498
33
63

D1+D2
291
166
83
-

D4
135
5
17

D1+D2+D3
654
194
97
-

M
edecin interne
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)

D2+D3+D4
783
173
99

D1
6
26
13
-

D3+D4
686
99
86

D1+D2
103
100
50
-

D4
93
4
11

D1+D2+D3
696
195
97
-

Evaluation de linterpr
etation des r
eseaux de neurones et de lanalyse discriminante Dans un deuxi`eme temps, pour chacun des deux jeux de donnees :
1. 16 param`etres issus de lACP sur les ECG durgence de la base de donnees de Lund,
utilises pour faire de lanalyse unaire.

Chapitre 2. Aide `a la decision en telecardiologie

43

Tab. 2.4 Meme resultats que dans le tableau 2.3, obtenus en prenant en compte une
information supplementaire : lECG de reference de chaque patient (analyse serielle)
Cardiologue
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)

D2+D3+D4
778
130
98

D1
11
69
34
-

D3+D4
583
43
73

D1+D2
206
156
78
-

D4
136
7
17

D1+D2+D3
653
192
96
-

M
edecin interne
Controles : n = 789
Infarctus (AMI) : n = 199
Sensibilite (%)
Specificite (%)

D2+D3+D4
779
168
98

D1
10
31
15
-

D3+D4
687
86
87

D1+D2
102
113
56
-

D4
304
14
38

D1+D2+D3
485
185
92
-

2. 32 param`etres issus de lACP sur les ECG durgence et de reference de la base de


donnees de Lund, utilises pour faire de lanalyse serielle.
jai effectue lapprentissage de deux comites de reseaux de neurones et de deux mod`eles
danalyse discriminante avec lensemble dapprentissage de 3703 patients. Larchitecture
des deux comites de reseaux de neurones peut etre definie comme suit :
Pour lanalyse unaire : un comite de 50 reseaux de neurones, avec une architecture
individuelle dune couche cachee de 10 neurones.
Pour lanalyse serielle : un comite de 50 reseaux de neurones, avec une architecture
individuelle dune couche cachee de 15 neurones.
Ensuite, jai evalue la performance des comites de reseaux de neurones et de lanalyse
discriminante sur les 988 paires dECG de lensemble de test. La sortie globale de chacun
des deux comites est la moyenne des sorties individuelles des 50 reseaux sur lensemble
de test.
Les aires sous les courbes ROC correspondant aux ensembles dapprentissage unaire
et seriel des reseaux de neurones sont respectivement de 0.92 et 0.98.
Les figures 2.6 et 2.7 illustrent les courbes ROC des 50 reseaux et de la sortie globale
des comites sur lensemble de test en analyse unaire et serielle.
Les deux figures montrent clairement une amelioration sensible des performances du
comite (aire sous la courbe ROC de 0.861) par rapport `a chacun des reseaux individuels
(meilleur reseau : aire sous la courbe ROC de 0.837), confirmant ainsi les resultats de la
litterature evoques plus haut dans la section 2.2.1. Cette augmentation des performances
est encore plus nette dans le cas de lanalyse serielle (comite : aire de 0.876, meilleur
reseau : aire de 0.838). Ce qui peut etre interprete comme une application du theor`eme

Chapitre 2. Aide `a la decision en telecardiologie

44

central limite.
1

0.9

0.8

Sensibilit

0.7

0.6

0.5

0.4

0.3

0.2

Sortie individuelle de chacun des 50 rseaux


Sortie globale du comit, aire = 0.861

0.1

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Spcificit

Fig. 2.6 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse unaire.
Enfin, les figures 2.8(a) `a 2.8(d) montrent les courbes ROC de lensemble des methodes
de diagnostic testees dans cette section : comites de reseaux de neurones, analyse discriminante, cardiologue et medecin interne, en analyse unaire et serielle.
En analyse unaire, les aires sous les courbes ROC sont respectivement de 0.861 pour
le comite de 50 reseaux de neurones, 0.753 pour lanalyse discriminante, 0.793 pour le
cardiologue et 0.713 pour le medecin interne.
En analyse serielle les performances sont sensiblement meilleures. Le comite de reseaux
de neurones affiche une aire sous la courbe ROC de 0.876, lanalyse discriminante une aire
de 0.787, le cardiologue une aire de 0.806 et le medecin interne une aire de 0.778.
Ces resultats montrent la superiorite des reseaux de neurones par rapport `a lanalyse
discriminante et linterpretation des experts humains en analyse unaire et serielle. De
meme, ils demontrent linteret de lanalyse serielle.

Chapitre 2. Aide `a la decision en telecardiologie

45

0.9

0.8

Sensibilit

0.7

0.6

0.5

0.4

0.3

0.2

Sortie individuelle de chacun des 50 rseaux


Sortie globale du comit, aire = 0.876

0.1

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Spcificit

Fig. 2.7 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenu
en analyse serielle.

2.2.3

Discussion

Il apparat clairement que les reseaux de neurones utilises en comite donnent de


meilleurs resultats que les methodes statistiques (plus particuli`erement ici lanalyse discriminante). En effet, si lanalyse discriminante donne des resultats equivalents `a ceux
dun reseau de neurones pris individuellement, la superiorite des reseaux de neurones provient de la combinaison de leurs resultats. On peut assimiler cette methode `a un syst`eme
multi-experts. Le theor`eme central limite montre donc son interet dans de telles situations.
La base de donnees de Lund sur laquelle nous avons travaille nechappe pas aux
probl`emes inherents aux bases de donnees medicales : en effet, on peut penser quelle ne
contient pas que des cas dinfarctus aigus et des cas parfaitement sains. Au contraire,
dautres maladies sont sans doute presentes dans les ECG, mais elles ne sont pas
referencees : elles peuvent donc fausser le diagnostic du classifieur. De plus, les diagnostics dinfarctus enregistres dans la base de donnees ont ete realises apr`es confirmation
ulterieure de linfarctus et `a partir de donnees medicales autres que lenregistrement. Le
diagnostic aurait pu etre different sil avait ete effectue seulement `a partir des ECG.
Enfin, et cest bien connu, il ny a pas de verite en medecine : des cas classes dans la
categorie de controle pourraient en realite tr`es bien faire partie de la categorie des AMI et
reciproquement. Les performances de nos classifieurs nen deviennent que plus relatives.
En effet, lECG enregistre `a ladmission ne represente quun instantane (en fait 10 sec)

(c) Cardiologue

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.1

0.1

0.3

0.5

0.6

1Spcificit

0.4

0.7

0.8

0.9

0.2

0.3

0.5

0.6

1Spcificit

0.4

0.7

0.8

0.9

ECG courant, aire = 0.713


ECG de rfrence + ECG courant, aire = 0.778

0.2

ECG courant, aire = 0.793


ECG de rfrence + ECG courant, aire = 0.806

(a) Comites de reseaux de neurones

Sensibilit

Sensibilit

0.9

Sensibilit
Sensibilit

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

0.1

0.1

0.2

0.2

0.3

0.3

0.5

0.6

0.5

0.6

1Spcificit

0.4

0.7

0.8

0.9

0.7

0.8

0.9

Paramtres unaires, aire = 0.753


Paramtres sriels, aire = 0.787

1Spcificit

0.4

Paramtres unaires, aire = 0.861


Paramtres sriels, aire = 0.876

Chapitre 2. Aide `a la decision en telecardiologie


46

(b) Analyse discriminante

(d) Medecin interne

Fig. 2.8 Comparaison des courbes ROC des differentes methodes en analyse unaire et
serielle.

Chapitre 2. Aide `a la decision en telecardiologie

47

de la vie du patient. Une ischemie presente `a cet instant peut tr`es bien se resorber toute
seule et ne pas provoquer une montee enzymatique ou au contraire, lECG `a ladmission peut etre tout `a fait normal et un infarctus aigu peut se developper une demi heure
apr`es. En fait, il faudrait enregistrer lECG en continu et le correler minute par minute ou
meme seconde par seconde avec des explorations quantitatives de letat du myocarde telles
que mesure continue des enzymes, imagerie continue par IRM. . . impossible `a realiser en
routine clinique.
Neanmoins, les resultats obtenus dans cette base de donnees de taille relativement importante montrent bien limportance de la variabilite inter-observateurs de linterpretation
humaine, meme en disposant dun trace de reference, et de laide au diagnostic qui doit
etre apportee, meme `a un cardiologue confirme. Comme relate recemment par Bates et
al [93], notre etude renforce de facon significative linteret dutiliser les technologies de
linformation pour ameliorer la precision diagnostique. A titre dillustration, pour une
specificite de 90%, la meilleure sensibilite de linterpretation humaine est de 52% alors
que la sensibilite de notre comite de reseaux de neurones atteint 67%, do`
u un gain de
15%.
Les perspectives doptimisation et damelioration de notre methode de classement par
reseaux de neurones sont nombreuses :
Une premi`ere piste damelioration est liee aux reseaux de neurones : optimisation
de larchitecture, du parametrage initial precedant lapprentissage, de lalgorithme
dapprentissage, de la combinaison des sorties individuelles des reseaux composants
le comite, etc.
Architecture du reseau. Il faut savoir que notre objectif etait devaluer la robustesse des reseaux de neurones. Nous avons pour cela utilise une configuration
determinee dans [22]. Cependant, un travail doptimisation doit etre fait pour
determiner larchitecture la plus adaptee `a ce type de probl`emes, cest `a dire
linterpretation automatique des ECG. Dans la litterature, de nombreux travaux de recherche ont permis de developper des methodes de reconstruction
automatique de larchitecture des reseaux de neurones moyennant des algorithmes genetiques [94].
Parametrage initial pre-apprentissage. Dans notre application, nous avons
choisi pour chaque reseau individuel un parametrage initial aleatoire des poids.
Si cette approche reste la plus simple et la plus souvent utilisee dans la
litterature, de nouvelles strategies privilegiant une selection ciblee du parametrage initial des reseaux ont commence `a prouver leur efficacite `a ameliorer
la performance des reseaux de neurones [95, 96].
Une deuxi`eme piste damelioration est liee `a lutilisation dinformations
supplementaires, en plus de lECG, tels que les donnees cliniques, lhistorique
medical, etc. de mani`ere `a etablir un diagnostic plus personnalise et plus adapte.
Cette approche est decrite dans la deuxi`eme partie de ce chapitre.

Chapitre 2. Aide `a la decision en telecardiologie

48

Conclusion
Actuellement, de nombreux travaux de recherche tentent de developper de nouvelles
approches daide `a la decision, dans le but de realiser des syst`emes intelligents qui tiennent
compte de la specificite de lutilisateur.
Le cas concret sur lequel nous avons travaille relevait du domaine de lelectrocardiologie
quantitative et de linterpretation automatique des ECG. Nous avons tout dabord propose un mod`ele original de traitement des donnees, puis nous nous sommes plus particuli`erement interesses `a la detection des ischemies. Les resultats obtenus montrent linteret
de lutilisation de comites de reseaux de neurones par rapport `a des methodes statistiques
(plus particuli`erement lanalyse discriminante). Le theor`eme central limite a montre sa
puissance : il permet daugmenter considerablement les performances des reseaux de neurones pris individuellement.
Quoiquil en soit, il nexiste certainement pas de methode universelle pour laide `a la
decision, mais il va falloir au contraire proceder par fusion de classifieurs et par fusion
de donnees en integrant davantage dinformation (donnees cliniques, historique medical,
etc.) dans le processus decisionnel.

2.3

Quantification du risque cardiovasculaire par approche probabiliste

Le syst`eme de decision embarque dans le PEM pour la detection des ischemies est
dans sa version actuelle base sur lutilisation de comites de reseaux de neurones artificiels
avec une generation dalarmes et de leur niveau prenant en consideration les scores de
risque evalues par les reseaux de neurones.
Cependant, pour obtenir un diagnostic plus precis et plus personnalise, nous avons
envisage une deuxi`eme approche qui consiste `a inclure dans le processus decisionnel une
stratification des informations cliniques du patient telles que les facteurs de risque. Le
fait dajouter une information supplementaire dans la decision finale devrait permettre
davoir une marge de securite supplementaire.
` titre dexemple, si pour un sujet sain de 45 ans sans antecedents cardiaques, le
A
module dinterpretation neuronal etablit un score diagnostic qui correspond `a une alarme
dimportance majeure, il est probable que lacquisition de lECG PEM ne se soit pas
deroulee correctement (position pendant lenregistrement, electrodes mal placees. . . ). Par
contre, si dans la famille il y a eu des antecedents dinfarctus avant 50 ans, il se pourrait
que lon soit en presence dune ischemie et il faudrait demander lavis dun cardiologue et
donc suggerer `a lutilisateur de transmettre lECG `a son medecin traitant ou `a un centre

Chapitre 2. Aide `a la decision en telecardiologie

49

de competences. Do`
u linteret de tenir compte des facteurs de risque de la personne
utilisatrice du PEM pour revoir `a la hausse ou `a la baisse le score de risque et lalarme
associee.
La figure 2.9 illustre levolution du processus decisionnel que nous preconisons de
mettre en place dans le PEM. La version actuellement embarquee dans le PEM consiste en
un module neuronal qui analyse lECG et en fonction du score de risque declenche lalarme
majeure, moyenne, mineure voire aucune alarme. La nouvelle version devrait inclure en
plus du module neuronal, un module de stratification des facteurs de risque que nous
allons decrire dans le reste de cette section. Ce module intervient apr`es linterpretation
de lECG PEM, lorsque lECG est juge comme suspect (ce qui correspond `a une alarme
moyenne ou mineure) soit pour confirmer le niveau dalarme, soit le modifier en fonction
des facteurs de risque du sujet.

Fig. 2.9 Schema synoptique du processus decisonnel embarque dans le PEM : a) sa version actuelle ; b) une future version que nous proposons avec lintroduction dun deuxi`eme
score de risque base sur le dossier medical du patient.

Chapitre 2. Aide `a la decision en telecardiologie

2.3.1

50

Choix m
ethodologiques

Pour fusionner des donnees quantitatives (taux de cholesterol, param`etres ECG. . . ) et


qualitatives (historique medical du patient) dans un seul et unique procede de decision,
differentes approches existent.

Approche heuristique
La premi`ere approche, qui a ete abordee dans le cadre dEPI-MEDICS, a consiste `a
concevoir un syst`eme `a base de r`egles, sous forme dalgorithmes (Figure 2.10). Ces r`egles
ont ete elaborees `a partir de directives et recommandations de comites dexperts de sante
publique en general et de cardiologie en particulier.

Fig. 2.10 Illustration dalgorithmes de stratification du risque cardiovasculaire


developpes dans le cadre dEPI-MEDICS.
` titre dexemple lalgorithme A2 calcule pour les sujets sains la probabilite dune
A
atherosclerose coronarienne en se basant sur la douleur thoracique en tant quinformation
de base. Il sagit du mod`ele probabiliste etabli par Diamond et al [97]. Ce mod`ele est base
sur trois types de douleur (douleur non-angineuse, douleur typique dangine de poitrine
ou douleur dangine de poitrine atypique), sur quatre classes dage (30-39, 40-49, 50-59,
60-69) et sur le sexe. Pour chaque variable, un score est donne (tableau 2.5) et le risque
dune maladie coronaire est donne en fonction du total des points.
En fait ces algorithmes nont pas vraiment ete implementes dans le PEM car meme si
lon sait calculer, `a partir de ces r`egles, des facteurs (score/index) de risque, aucun expert
na ete capable dindiquer concr`etement comment combiner ces scores avec linterpretation
des ECG pour moduler le degre dalarme.

Chapitre 2. Aide `a la decision en telecardiologie

51

Tab. 2.5 Scores de risque en pourcentage de la survenue dune maladie coronaire en


fonction de lage, du sexe et des caracteristiques de la douleur de thoracique. Dapr`es
Diamond et Forrester, N Engl J Med 1979.
douleur non-angineuse
Age
H
F
30-39 5.2
0.8
40-49 14.1
2.8
50-59 21.5
8.4
60-69 28.1
18.6

douleur atypique dangine


Age
H
F
30-39 21.8
4.2
40-49 46.1
13.3
50-59 58.9
32.4
60-69 67.1
54.4

douleur typique
Age
H
30-39 69.7
40-49 87.3
50-59 92.0
60-69 94.3

dangine
F
25.8
55.2
79.4
90.6

Approche probabiliste
Lautre approche consiste `a utiliser des methodes dintelligence artificielle pour
developper des mod`eles de quantification du risque cardiovasculaire `a partir des connaissances medicales et des bases de donnees cliniques. Notre objectif est dutiliser la methode
qui pallie au mieux les probl`emes specifiques poses par notre application : prendre des
decisions basees sur des donnees incompl`etes et de natures differentes et expliquer le raisonnement en fonction des resultats. Cest pour ces raisons que nous avons choisi une
approche probabiliste basee sur lutilisation des reseaux bayesiens pour realiser notre module de facteurs de risque.
En effet, selon le type dapplication, lutilisation des reseaux bayesiens peut etre envisagee au meme titre que celle dautres mod`eles : reseaux de neurones, syst`emes experts,
arbres de decision, etc. Les aspects suivants des reseaux bayesiens les rendent, dans de
nombreux cas, preferables aux autres mod`eles :
Acquisition des connaissances : Les reseaux bayesiens donnent la possibilite de rassembler et de fusionner des connaissances de diverses natures dans un meme mod`ele.
Representation des connaissances : La representation graphique dun reseau bayesien
est explicite, intuitive et comprehensible par un nonspecialiste, ce qui facilite `a la
fois la validation du mod`ele, ses evolutions eventuelles et surtout son utilisation.
Typiquement, un decideur est beaucoup plus enclin `a sappuyer sur un mod`ele dont
il comprend le fonctionnement qu`a faire confiance `a une mod`ele Bote noire.
Utilisation des connaissances : Un reseau bayesien est polyvalent, i.e. on peut se servir du meme mod`ele pour evaluer, prevoir, diagnostiquer, ou optimiser des decisions,
ce qui contribue `a rentabiliser leffort de construction du reseau bayesien.
Enfin, linteret de lapproche des reseaux bayesiens [55] par rapport `a dautres techniques dintelligence artificielle telles que les reseaux de neurones. . . est justifie par leur
capacite `a modeliser lincertitude inherente au raisonnement medical et `a prendre des
decisions basees sur des donnees incompl`etes et de natures differentes (discr`ete, continue)
[98]. Les applications cliniques mettant en uvre lutilisation les reseaux bayesiens sont

Chapitre 2. Aide `a la decision en telecardiologie

52

variables : de laide au diagnostic `a limagerie et au traitement du signal, en passant par


lanalyse de donnees, etc. [99, 100, 101, 102].
Dans le reste de cette section, nous allons presenter les reseaux bayesiens et leur mise
en uvre sur une base de donnees clinique : la base de donnees INDANA [103]. Cette
base de donnees reunit des donnees medicales individuelles (age, sexe, cholesterol. . . ) de
patients presentant une hypertension arterielle avec un suivi sur 7 ans et lenregistrement
de la survenue ou de la non survenue des evenements cardiovasculaires suivants : infarctus,
accident vasculaire cerebral (AVC), mort dorigine cardiovasculaire. Nous entranerons le
reseau bayesien `a utiliser ces donnees pour predire le risque cardio-vasculaire, et nous comparerons ses performances par rapport `a deux autres methodes utilisees comme temoin :
les reseaux de neurones, et lanalyse discriminante.

2.3.2

Les r
eseaux bay
esiens

Les reseaux bayesiens [50] font partie de la famille des mod`eles graphiques qui regroupent entre autres : les mod`eles de Markov caches, les filtres de Kalman, etc. Ces
mod`eles sont le mariage entre la theorie des probabilites et celle des graphes. Dans cette
section, nous allons commencer par presenter quelques principes et concepts de base des
mod`eles graphiques. Ensuite nous allons nous focaliser sur un mod`ele particulier de la
famille des mod`eles graphiques : les reseaux bayesiens en termes de structure, param`etres
et inference.

Terminologie
Un mod`ele graphique est un outil utilise pour illustrer visuellement (theorie des
graphes) et representer de facon factorisee une distribution conjointe de probabilites sur un
ensemble de variables dun probl`eme donne (theorie des probabilites) [104]. Un graphe est
compose dune serie de nuds 1 , representant les variables et evenements du monde reel,
connectes par des aretes, representant les interactions entre les nuds, qui peuvent etre
orientees. Dans ce dernier cas, nous pouvons parler de graphe oriente (Directed Graph,
DG).
Une chane est une serie de nuds telle que chacun de ces nuds est connecte `a son
predecesseur via une arete. Un chemin est une chane telle que chaque arete est orientee
dans la meme direction que la chane. Un cycle est un chemin qui commence et se termine
au meme nud. Un chemin est dit simple si et seulement si chaque nud est visite
une seule fois. Un cycle est dit simple si, et seulement si, tous ses nuds sont uniques `a
lexception du nud de depart et de celui darrivee. Un graphe acyclique oriente (Directed
Acyclic Graph : DAG) est un graphe oriente qui na pas de cycles.
1

Dans la suite du rapport, les termes nuds et variables seront employes de facon interchangeable

Chapitre 2. Aide `a la decision en telecardiologie

53

Dans un DAG, une arete lie un nud, intitule parent, `a un autre nud, intitule enfant.
Si X1 est le parent de X2 et X2 est le parent de X3 , alors X1 est un ancetre de X3 et
X3 est `a son tour un descendant de X1 . Une famille est formee dun nud X et de ses
parents.
Une foret est un DAG tel que chaque nud a au plus un parent. Un arbre est une
foret o`
u chaque nud a un parent et un seul sauf la racine de larbre. Une corde est une
arete connectant deux nuds non-consecutifs. Un graphe triangule est un DAG o`
u tous
les cycles de longueur 3 ont forcement une corde.
Le terme complet decrit un graphe non-oriente o`
u chaque nud est connecte au reste
des nuds du graphe. Un cluster est simplement un sous-groupe de nuds dans un graphe.
Une clique est le plus grand ensemble de nuds, connectes deux `a deux : il sagit dun
sous-graphe complet.

G
en
eralit
es
Un reseau bayesien est une version particuli`ere de mod`eles graphiques representee sous
forme dun DAG dont les nuds incarnent les objets et evenements du monde reel. Les
relations cause `a effet entre les nuds sont representees par des aretes orientees du nud
cause vers le nud effet (Figure 2.11).
Chaque nud a une distribution de probabilite conditionnelle P(Xi |P arents(Xi )) qui
quantifie leffet du parent sur le nud. Une probabilite a priori est affectee aux nuds
racines (sans parents).

Fig. 2.11 Reseau bayesien simple


La specification probabiliste du reseau bayesien passe par la representation dune distribution de probabilite conjointe pour tous ses nuds. Cette distribution conjointe est
defini comme le produit des distributions conditionnelles locales :
P (X1 . . . , Xn ) =

N
Y

P (Xi |P a(Xi ))

i=1

o`
u P a(Xi ) designe lensemble des parents du nud Xi .

(2.4)

Chapitre 2. Aide `a la decision en telecardiologie

54

` partir des probabilites conditionnelles, de la structure du reseau et de la distribution


A
de la probabilite conjointe, nous pourrons alors calculer la probabilite a posteriori quun
nud prend tel ou tel etat. La probabilite a posteriori P (X|Y ) etant donnee la probabilite
a priori P (X) et la probabilite conditionnelle P (Y |X) de Y sachant que X est vrai (true)
est donnee par la theor`eme de Bayes comme suit :
P (X|Y ) =

P (Y |X)P (X)
P (Y )

(2.5)

Pour configurer un reseau bayesien, il est necessaire de specifier les Distributions des
Probabilites Conditionnelles (CPD) pour tous les nuds ayant des parents et la probabilite
a priori des nuds racines.

Inf
erence et arbre de jonction
Par definition, linference consiste `a calculer la probabilite de chaque etat dun nud
dans un reseau bayesien, quand dautres nuds sont observes. Plusieurs algorithmes ont
ete proposes pour realiser linference. Le plus repandu est lalgorithme de larbre de jonction [105, 106, 107].

Fonctionnement Lalgorithme de larbre de jonction est un processus `a trois etapes :


transformation, propagation et marginalisation.
1. letape de transformation consiste `a construire un arbre de jonction `a partir du
reseau bayesien
2. letape de propagation, comme son nom lindique, consiste `a propager le vecteur des
valeurs de nuds observes puis `a realiser linference sur larbre de jonction
3. letape de marginalisation consiste `a marginaliser les variables non-observees du
reseau.
Nous allons illustrer la mani`ere dont lalgorithme proc`ede en reprenant le meme
exemple que dans [55] : il sagit dun reseau bayesien modelisant le comportement du
marche boursier (indice boursier en hausse, en baisse, voire effondre). Ce comportement
est estime par rapport au bug de lan 2000 et est sense modeliser ses repercussions sur
le secteur electrique, les reseaux de telecommunications, les transports, le service public
et le secteur financier (banques) (Figure 2.12). Les rapports dinfluence sont indiques `a
` noter quil
travers les liens orientes (cause `a effet) entre les diverses variables du reseau. A
ne sagit que dune representation simplifiee dun cas reel beaucoup plus complexe et dans
lequel de nombreux facteurs entrent en jeu.

Transformation en arbre de jonction

Chapitre 2. Aide `a la decision en telecardiologie

55

Fig. 2.12 Reseau bayesien bug an 2000.


Moralisation : la moralisation dun graphe consiste `a connecter les parents des nuds
deux `a deux et `a enlever lorientation des aretes. La moralisation de notre reseau
engendre la creation de 3 aretes supplementaires Rail-Transport aerien, TransportsService public et Transports-Banques (Figure 2.13).

Fig. 2.13 Meme graphe que Figure 2.12 apr`es moralisation.


Triangulation : Un graphe non-oriente est triangule si tous les cycles de plus
de 3 nuds ont une corde. La triangulation est realisee `a travers un processus
delimination2 de nuds comme suit :
1. pour i=1 `a N (N designe le nombre de nuds)
(a) selectionner le nud qui engendre lajout dun minimum daretes lorsquil
est supprime. Si nous avons le choix entre plusieurs, alors il faut choisir
2

Lelimination dun nud u dans un graphe non-oriente consiste `a dabord connecter tous ses nuds
voisins deux `a deux et ensuite `a supprimer le nud u et toutes les aretes connectees `a ce nud

Chapitre 2. Aide `a la decision en telecardiologie

56

celui qui induit le cluster ayant le plus petit poids3


(b) connecter tous les nuds du cluster induit par le nud selectionne
(c) retenir le cluster induit sil nest pas un sous-ensemble dun des clusters
retenus au cours des iterations precedentes
(d) supprimer le nud selectionne du graphe
2. modifier le graphe initial en ajoutant les aretes que nous venons de creer.
La figure 2.14 presente le reseau bayesien moralise et triangularise.

Fig. 2.14 Meme graphe que Figure 2.12 apr`es triangulation.


Construction de larbre de jonction : Les clusters retenus (tableau 2.6) du processus
de triangulation constituent `a leur tour les nuds de larbre de jonction. Le probl`eme
reside alors dans la mani`ere de les connecter afin de satisfaire la definition dun arbre
de jonction. Cela peut etre effectue via lalgorithme cite dans [55] comme suit :
1. creer n arbres, chacun contenant une seule clique.
2. pour chaque paire de cliques A et B : creer un separateur, SAB , contenant
lintersection A B
3. recommencer le processus jusqu`a ce que n-1 separateurs soient crees et inseres
dans la foret, ensuite
(a) selectionner et enlever le separateur SAB ayant la plus grande masse4 de
la liste des separateurs. Si deux separateurs ont une meme masse, alors il
faut supprimer celui qui a le plus petit co
ut5
3

La notion de poids est definie comme suit :

le poids dun nud est defini comme le nombre detats que ce nud peut prendre
le poids dun cluster est le produit des poids de ses nuds
4
5

La masse dun separateur est le nombre de variables quil contient


Le co
ut dun separateur SAB est le poids de A plus le poids de B

Chapitre 2. Aide `a la decision en telecardiologie

57

Tab. 2.6 Illustration du deroulement de lalgorithme de triangulation. Les clusters


retenus pour larbre de jonction sont marques par une etoile (*).

Etape
1

Ar
etes

elimin
ees
Bourse

Ar
etes
ajout
ees
-

Telecom

Electricite-Banques

Transport aerien

Electricite-Transports

4
5

Rail
Electricite

6
7
8

Transports
Banques
Service public

Cluster
induit
Banques, Service public, Transports,
Bourse*
Electricite, Banques, Service public,
Telecom*
Electricite, Transports, Rail,
Transport aerien*
Electricite, Transports, Rail
Service public, Banques, Transports,
Electricite*
Banques, Service public, Transports
Service public, Banques
Service public

(b) si deux cliques A et B se trouvent dans deux arbres distincts de la foret,


alors il faut les connecter en inserant SAB entre eux, ce qui signifie la fusion
des deux arbres
4. larbre final obtenu represente larbre de jonction souhaite (Figure 2.15).

Initialisation du r
eseau
Lorsque larbre de jonction est pret, letape suivante consiste `a linitialiser en affectant
des fonctions de potentiels 6 `a ses nuds comme suit :
1. pour chaque cluster et separateur, initialiser le potentiel `a 1
A 1
2. pour chaque nud u, attribuer un cluster A contenant la famille de u (u et ses
parents). Ensuite, inserer la probabilite conditionnelle P (Xu |Xpa(u) ) dans A comme
suit :
A A .P (Xu |Xpa(u) )

Propagation et marginalisation La marginalisation des nuds du reseau bayesien


se fait `a travers un algorithme de propagation globale qui consiste `a passer un message
(information nouvelle) dune clique `a une autre, filtre `a travers les separateurs entre ces
cliques. Un passage de message (message passing) entre deux clusters A et B consiste `a :
6
Un potentiel A sur un ensemble de variables Xa est une fonction qui prend lensemble des affectations
possibles des valeurs des variables de Xa et rend une valeur dans lintervalle [0, [

Chapitre 2. Aide `a la decision en telecardiologie

58

Fig. 2.15 Larbre de jonction obtenu `a partir du reseau bayesien avec les clusters retenus
du processus de triangulation (ovales) et les separateurs induits (carres).
passer le message du cluster A vers le separateur SAB , ce qui implique la mise `a
jour du potentiel du separateur
ancien S
SAB : SAB
AB
SAB A|SAB A
passer le message du separateur SAB vers le cluster B, soit :
SAB
B ancien
B
ancien
S
AB

Introduction dobservations Lobservation (evidence) est representee sous forme


dune fonction de vraisemblance (likelihood ) dune variable Xu notee Xu (xu ) qui est
calculee comme suit :
lorsque la variable Xu est observee, la fonction de vraisemblance est :
Xu (xu ) = {

1
0

lorsque xu est letat observe de


dans le cas contraire

Xu

(2.6)

lorsque Xu nest pas observe, la fonction de vraisemblance est une constante,


Xu (xu ) n1 , pour les n etats xu de Xu .
Lorsquune observation (Xu = xu ) est entree dans le reseau, la mise `a jour des fonctions
de vraisemblance se fait de la mani`ere suivante :

Chapitre 2. Aide `a la decision en telecardiologie

59

codage de lobservation sous forme de fonction de vraisemblance nouvelle


Xu
identification du cluster A contenant u et mise `a jour de A et Xu comme suit :
1. A A nouvelle
Xu
2. Xu nouvelle
Xu

2.3.3

Apprentissage des r
eseaux bay
esiens

Lapprentissage dun reseau bayesien doit permettre destimer les probabilites conditionnelles de chaque nud du reseau `a partir dun echantillon de donnees.

Cas de donn
ees compl`
etes
Dans le cas o`
u toutes les variables sont observees, la methode la plus simple et la plus
utilisee est lestimation statistique qui consiste `a estimer la probabilite dun evenement
par la frequence dapparition de levenement dans la base de donnees. Cette approche,
appelee maximum de vraisemblance (MV), nous donne alors :
P (Xi = xk |parent(Xi ) = cj ) = i,j,k =

Ni,j,k
k Ni,j,k

(2.7)

o`
u, Ni,j,k est le nombre devenements dans la base de donnees pour lesquels la variable
Xi est dans letat xk et ses parents sont dans la configuration cj .

Cas de donn
ees incompl`
etes
Dans les applications pratiques, les bases de donnees sont tr`es souvent incompl`etes.
Certaines variables ne sont observees que partiellement ou meme jamais. La methode
destimation de param`etres avec des donnees incompl`etes la plus couramment utilisee est
fondee sur lalgorithme iteratif EM (Expectation - Maximisation) [108, 109]. Il sagit dune
methode generale doptimisation qui peut etre appliquee dans certains cas de maximum
de vraisemblance (Maximum Likelihood) destimation des param`etres comme suit :
= arg max P(X = x|, M )

(2.8)

o`
u est un vecteur de param`etres, X est une variable aleatoire ayant x comme valeurs
observees, et M est le mod`ele (reseau bayesien,. . . ).

Chapitre 2. Aide `a la decision en telecardiologie

60

D
eroulement Lalgorithme E.M. est base sur une decomposition du probl`eme doptimisation grace `a lintroduction dune variable aleatoire z dite cachee dans le mod`ele ce
qui rend le probl`eme doptimisation analytiquement faisable.
Toutefois, au lieu dessayer de maximiser la vraisemblance des donnees observees
P (X|), nous allons maximiser la vraisemblance de la distribution jointe de X et Z =
{zi }N
esigne le nombre de classes), P (X, Z|). Nous allons utiliser le logarithme de
1 (N d
cette formule, log(P (X, Z|)). En plus, puisque nous ne pouvons pas connatre les valeurs
des variables aleatoires zi , nous utilisons lesperance (expectation) de cette quantite, soit
une distribution quelconque Q(Z). Lalgorithme E.M. consiste en deux etapes (E-step et
M-step) qui seront executees `a chaque iteration comme suit :

E-step Elle consiste `a calculer la valeur esperee (expected value) du log-probabilite


de la distribution jointe de X et Z comme suit :
Q(, k ) = EZ [log(P (X, Z|, M ))|X = x, k ]

(2.9)

M-step Au cours de cette etape les param`etres sont mis `a jour comme suit :
k+1 = arg max Q(, k )

(2.10)

k designe la serie des valeurs des param`etres obtenues `a la k`eme iteration de lalgorithme.
Ces deux etapes seront repetees jusqu`a ce que lalgorithme converge vers un maximum : tant que |k k1 | .

2.3.4

Configuration du mod`
ele probabiliste de stratification du
risque cardiovasculaire

Lobjectif est realiser un outil de prediction individualisee du risque cardio-vasculaire,


en vue de le combiner avec le mod`ele de reseaux de neurones. Nous posons le probl`eme de
la prediction du risque cardio-vasculaire comme un probl`eme dapprentissage supervise
`a partir de donnees de suivi de populations `a risque, dans lequel levenement `a predire
est represente par deux classes, survenue ou non survenue dun evenement cardiaque
(infarctus, accident vasculaire cerebral, mort dorigine cardiovasculaire). Pour realiser cet
objectif nous avons utilise la base de donnees INDANA [103] que nous presentons rapidement ci-apr`es. Puis nous decrivons la structure du reseau bayesien dont nous evaluons
les performances en reference `a un mod`ele neuronal et danalyse discriminante.

Chapitre 2. Aide `a la decision en telecardiologie

2.3.5

61

La base de donn
ees INDANA

La base de donnees INDANA [103] reunit les donnees individuelles de 10 essais


therapeutiques randomises et conduits pour evaluer dans le temps lefficacite de traitements anti-hypertenseurs. Les sujets faisant partie de cette base de donnees ont ete suivis,
en moyenne, sur une periode de 5 ans durant laquelle toute incidence devenements de
nature cardiovasculaire a ete relevee : accident vasculaire cerebral, infarctus du myocarde,
dec`es par accident vasculaire cerebral, dec`es par infarctus du myocarde. La survenue dun
evenement cardiovasculaire est code 1, labsence devenement est code 0 (cas controle).
Pour chaque patient, la base de donnees contient, au minium, des donnees
demographiques, medicales et cliniques enregistrees au debut du suivi : age, sexe, pression arterielle systolique et diastolique, indice de masse corporelle, etc., ainsi que les
antecedents dinfarctus du myocarde, daccident vasculaire cerebral, de diab`ete et de traitement antihypertenseur.
Parmi ces variables, nous en avons retenu 13 pour leur pertinence vis `a vis de la
stratification du risque cardiovasculaire. Elles sont listees dans la table 2.7.
Tab. 2.7 Variables retenues pour realiser les mod`eles de stratification : reseau bayesien,
comite de reseau de neurones et analyse discriminante.
Variable

Age

Type
continu
Pression arterielle systolique
continu
Pression arterielle diastolique
continu
Indice de masse corporelle
continu
Cholesterolemie totale
continu
Taux de glucose sanguin
continu
Sexe
discret
Hypertrophie ventriculaire gauche
discret
Antecedent dinfarctus de myocarde
discret
Antecedent daccident vasculaire cerebral
discret
Antecedent de diab`ete
discret
Antecedent de traitement antihypertenseur discret
Tabagisme
discret
Evenement cardiovasculaire

discret

Enfin, la base de donnees INDANA a ete divisee de facon aleatoire en 2 sous-ensembles


afin dobtenir un ensemble dapprentissage de 15013 cas pour la configuration du reseau
bayesien et un ensemble de test de 5004 sujets pour evaluer la performance du reseau
bayesien. Les memes ensembles dapprentissage et de test ont ensuite ete utilises pour

Chapitre 2. Aide `a la decision en telecardiologie

62

entraner et tester le mod`ele danalyse discriminante et un comite de reseaux de neurones.

2.3.6

R
ealisation du r
eseau bay
esien

Un reseau bayesien est un mod`ele probabiliste causal. En dautres termes, les variables
sont liees par un lien de cause `a effet : predecesseurs et successeurs. Pour cette raison,
le choix dune structure modelisant le probl`eme en question est crucial. Meme, si des
algorithmes dapprentissage de structures ont ete developpes, lapproche manuelle reste
la plus fiable et la plus souvent adoptee.
La structure du reseau bayesien a ete determinee de facon manuelle en se basant sur les
connaissances theoriques [9, 11, 110] et le savoir-faire des experts du domaine, notamment
avec laide du docteur Gueyffier de lHopital Cardiologique de Lyon. En effet une serie de
reunions avec le docteur Gueyffier ma permis :
Dabord detudier et analyser la base de donnees INDANA afin dextraire les variables qui pourraient servir dans lelaboration du mod`ele de stratification du risque
cardiovasculaire.
Ensuite, de determiner les influences en termes de liens de cause-`a-effet entre les
diverses variables du mod`ele.
Enfin, de tester divers configurations de reseaux bayesiens. Ces configurations sont
determinees en fonction du nombre de variables utilisees et les liens causaux entre
ces variables.
A noter que nous aurions pu adopter une des diverses approches de recueil de connaissances utilises surtout dans lelaboration des syst`emes experts et des syst`emes de gestion de bases de connaissances : les outils et methodes proposes pour aider au transfert
dexpertise (KADS [111], KOD [112],. . . voire ceux permettant dapprendre de nouvelles
connaissances `a partir dexemples [113, 114]. Mais du fait quil ne sagit que dun premier
essai pour evaluer la faisabilite dune telle approche, `a savoir les reseaux bayesiens, jai
opte pour une simple collaboration avec le cardiologue.
La figure 2.16 illustre le reseau bayesien que nous avons utilise pour stratifier les
facteurs de risque. Ce reseau prend en entree les donnees cliniques, demographiques, lhistorique medical, etc. du patient et donne une estimation du risque de la survenue dun
evenement cardiovasculaire.
Enfin, pour creer notre mod`ele de reseau bayesien, nous avons utilise le logiciel
BayesialabTM .

Chapitre 2. Aide `a la decision en telecardiologie

63

Fig. 2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire.


R
ealisation du comit
e de r
eseaux de neurones
Notre objectif etant uniquement devaluer la robustesse du reseau bayesien par rapport
`a un temoin, nous avons choisi de levaluer par rapport `a un comite de 50 reseaux de
neurones que nous avons configure comme suit :
Apprentissage : lapprentissage est realise comme pour linterpretation des ECG
en nous basant sur la methode de Levenberg-Marquardt [87, 88]. Pour eviter le
phenom`ene de sur-apprentissage, nous avons utilise la methode darret precoce (early
stopping), dej`a decrite dans la section 2.2.1.
Fonctions dactivation : comme nous voulons avoir en sortie du reseau des valeurs
comprises entre 0 et 1, nous utilisons par 2 fois des fonctions logarithme-sigmode.
Architecture neuronale : le choix dune seule couche cachee avec 10 neurones sur la
couche cachee semble etre un bon compromis entre la complexite (et donc le temps
de calcul) et la performance du reseau (Figure 2.17).
Le mod`ele de reseaux de neurones a ete realise avec MatlabTM et la boite `a outils
reseaux de neurones de Matlab.

Chapitre 2. Aide `a la decision en telecardiologie

64

Fig. 2.17 Illustration de la structure individuelle des reseaux de neurones utilises pour
estimer le risque cardiovasculaire.

2.3.7

R
esultats

Les trois methodes de stratification du risque cardiovasculaire ont ete evaluees sur
lensemble de test de 5004 cas extrait de la base de donnees INDANA en comparant les
courbes ROC. Levaluation a montre une large superiorite de lapproche bayesienne, avec
une aire sous la courbe ROC de 0.80 contre 0.75 pour le comite de reseaux de neurones
et 0.74 pour le mod`ele danalyse discriminante.

2.3.8

Discussion

Le choix dun raisonnement probabiliste `a base de reseaux bayesiens est justifie pour
deux raisons :
la portabilite : le mod`ele peut etre facilement etendu `a dautres maladies cardiovasculaires. Rappelons que le PEM est `a la base configure pour detecter les arythmies
et lischemie.
la simplicite : Au del`a de lapprentissage automatique en termes de probabilites
conditionnelles et a priori des facteurs de risque, le fait quil sagit dun mod`ele
probabiliste graphique permet denvisager que le medecin traitant de lutilisateur
du PEM puisse regler les param`etres du reseau (probabilites a priori, liens causeeffet. . . ) de mani`ere `a affecter dun poids plus important un facteur de risque
specifique au patient.

Chapitre 2. Aide `a la decision en telecardiologie

2.3.9

65

Conclusion

Le mod`ele propose nest quun prototype qui permet detablir une prediction individualisee du risque cardio-vasculaire chez des patients presentant une hypertension arterielle
[115]. Cela signifie que pour une population plus large, dautres facteurs que le mod`ele
na pas pris en consideration, pourraient influencer la survenue dune maladie cardiaque.
De meme, limpact des facteurs en termes de liens cause-effet pourrait etre different. La
prochaine etape serait donc devaluer le mod`ele sur dautres bases de donnees, voire de
configurer plusieurs variantes du mod`ele qui seraient adaptees `a une serie de profils types
de lutilisateur du PEM.

2.4

Vers un mod`
ele multi-classifieurs multi-modules
du diagnostic de linfarctus : Interaction du module neuronal et du module bay
esien dans le processus d
ecisionnel global

Lutilisation du module neuronal dinterpretation de lECG avec des seuils de risque


reglables en fonction de la personne utilisatrice du PEM devrait permettre dameliorer la
sensibilite de detection dune ischemie. Cependant, il y a un interet capital `a reduire le taux
des faux-negatifs tout en maintenant une sensibilite optimale. Cela nest pas realisable
sans lintroduction du module bayesien avec une interaction suffisamment souple entre les
deux modules. Cest la raison pour laquelle letape finale dans la realisation du module
decisionnel du PEM devrait etre lintroduction dune couche logicielle pilote qui va gerer
linteraction entre les modules et emettre lalarme la plus appropriee. Il sagit dun syst`eme
`a base de r`egles traitant tous les cas de figures possibles. Pour realiser ce syst`eme, on peut
utiliser une approche classique de r`egles basee soit sur la logique booleenne soit sur la
logique dite floue.
Dans le PEM, nous envisageons de concevoir un syst`eme `a base de r`egles floues [116,
117, 118]. Le choix dune telle technologie est lie au fait que la logique floue permet
dintroduire une graduation dans des notions auparavant soit vraies soit fausses. En effet,
sappuyant sur la theorie mathematique des sous-ensembles flous qui est une extension de
la theorie des ensembles classiques pour la prise en compte densembles definis de facon
imprecise, la logique floue est utilisee dans des domaines aussi varies que lautomatisme, la
robotique, lenvironnement, la medecine (aide au diagnostic), etc. Linteret de la logique
floue est dassurer que les differentes methodes de diagnostic ne soient pas en competition,
mais au contraire, on cherchera `a utiliser leur complementarite pour ameliorer le processus
decisionnel. Dans la suite de cette section, nous presentons bri`evement la logique floue,
son interet, ses concepts et un exemple de mise en uvre dapplications de r`egles floues,
ainsi que ce qui pourrait etre le scenario decisionnel global dans le PEM apr`es deploiement

Chapitre 2. Aide `a la decision en telecardiologie

66

` noter que la realisation


des modules neuronal, bayesien et du syst`eme de r`egles floues. A
du syst`eme de logique floue et la validation du scenario global necessite davoir une base
de donnees contenant `a la fois des ECG seriels, ainsi que des dossiers medicaux exhaustifs
pour chaque patient. Cette base de donnees, en cours de construction, specifique au PEM,
devrait permettre de realiser et valider le mod`ele decisionnel global presente ci-apr`es.
Le scenario decisionnel global (Figure 2.18) devrait etre comme suit :
Un patient X, presentant un certain nombre de signes de gene se sert de son PEM
pour enregistrer un ECG
Une fois enregistre et charge dans le syst`eme, lECG sera interprete par le module
neuronal et un premier score de risque est calcule.
En fonction de ce score, lECG est juge comme : anormal, suspect, ou normal :
Si lECG est anormal, lalarme majeure est declenchee.
Si lECG est normal, un message confortant est emis `a lutilisateur.
Si lECG est suspect, le premier score de risque sera conjugue avec un deuxi`eme
score de risque issu du module bayesien et le score de risque global permettra de
declencher lalarme appropriee : majeure, moyenne, mineure.
Cette approche qui est lune des perspectives de recherche future de nos travaux
pour etre evaluee sur la base de donnees qui est en cours de constitution grace aux
experimentations pilotes qui sont actuellement realisees avec les PEM prototypes.

Chapitre 2. Aide `a la decision en telecardiologie

67

Fig. 2.18 Proposition dun mod`ele decisionnel global incorporant des modules bayesien
et neuronal qui collaborent par lintermediaire dun syst`eme de r`egles de logique floue.

Chapitre 3
Acquisition de lECG PEM et
synth`
ese de lECG standard
3.1

Introduction

Un des objectifs du projet EPI-MEDICS est de permettre `a lutilisateur denregistrer ses propres ECG sans la moindre assistance. Cest la raison pour laquelle le syst`eme
denregistrement ECG du PEM est base sur un nombre limite delectrodes (4), faciles `a
positionner, correspondant respectivement aux derivations peripheriques (DI, DII) et `a la
derivation precordiale V2. Ce syst`eme simplifie, pseudo-orthogonal, presente neanmoins
lavantage de recueillir la quasi-totalite de linformation spatio-temporelle de lactivite
electrique cardiaque. Or, dans le cas o`
u une situation dalarme est detectee et envoyee
par le PEM, il est necessaire de rendre lECG critique accessible par le cardiologue destinataire de lalarme, sous forme comprehensible et interpretable, `a savoir lECG 12D, qui
est, en pratique clinique, le mode de representation electrocardiologique le plus usite de
par le monde. Il est ainsi essentiel de synthetiser un ECG standard 12D `a partir de lECG
3D du PEM. Cette reconstruction doit permettre non seulement une detection precise
de lischemie, mais egalement une reproduction la plus fid`ele possible des caracteristiques
quon pourrait avoir dans lECG standard 12D si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM.
La plupart des investigations anterieures sur la synth`ese de lECG ont generalement
adopte des techniques de modelisation lineaires telles que la regression multiple. Or, ces
methodes sont tr`es sensibles `a la position des electrodes, au bruit musculaire et aux
artefacts causes par les mouvements des bras et du corps, aux interferences avec dautres
appareils,. . . Ces perturbations peuvent produire une difference significative entre les ECG
et par la suite empecher une bonne qualite de synth`ese. En outre, les methodes de synth`ese
decrites dans la litterature sont quasiment toutes basees sur des methodes dapproximation
par un mod`ele lineaire [119, 120, 121], alors que le rapport entre les signaux cardiaques
nest pas forcement un processus lineaire [122, 123].

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

69

A notre connaissance, seuls Scherer et al [124] ont abordes le probl`eme de la nonlinearite de la synth`ese de lECG standard 12D `a partir dun sous-ensemble de derivations
(DI, DII, V2) en proposant une technique de synth`ese lineaire par parties obtenue en divisant le signal ECG en quatre portions : le segment PR, le complexe QRS, le segment
ST-T (y compris londe T) et lintervalle TP. Pour chaque portion du signal, un mod`ele
de regression lineaire multiple calcule une matrice de transformation minimisant lerreur
quadratique moyenne (RMS) entre le signal original et le signal synthetise. Linconvenient
majeur de cette approche concerne les discontinuites introduites au niveau des extremites
de chaque segment, discontinuites qui sont amplifiees par les niveaux des lignes de bases
des derivations DI, DII et V2. Ceci rend la methode de reconstruction extremement sensible aux modifications des tensions de polarisation des electrodes et explique pourquoi
cette methode nest pas utilisee en routine clinique. Cest la raison pour laquelle jai
decide de morienter vers des techniques resolument non-lineaires basees sur des reseaux
de neurones.
Dans la suite de ce chapitre nous allons tout dabord presenter les modalites dacquisition de lECG PEM, puis une methode originale de synth`ese de lECG standard 12D `a
partir de lECG PEM 3D mettant en uvre des comites de reseaux de neurones artificiels,
Enfin nous evaluerons notre approche comparativement aux methodes traditionnelles de
la litterature.

3.2

Modalit
es dacquisition de lECG PEM

Le syst`eme dacquisition de lECG du PEM est base sur le positionnement dit de


Mason-Likar des derivations peripheriques DI et DII, et sur la derivation precordiale
V2.
Les electrodes doivent etre positionnees comme indique dans la figure 3.1 :
Lelectrode JAUNE doit etre placee sur lepaule gauche (`a environ 2 cm de
lextremite basse de la clavicule), le plus loin possible du coeur.
Lelectrode ROUGE doit etre placee sur lepaule droite (`a environ 2 cm de
lextremite basse de la clavicule), le plus loin possible du coeur.
Lelectrode BLANC doit etre placee dans le quatri`eme espace intercostal (cest`a-dire pour les hommes, approximativement sur la ligne joignant les 2 mamelons),
`a peu pr`es `a 2 cm `a gauche du sternum.
Lelectrode VERT doit etre placee sur la hanche gauche (dans la crete iliaque
gauche).
Lelectrode NOIR doit etre placee sur la hanche droite (dans la fosse iliaque
droite).
Rappelons que le syst`eme Mason-Likar est le syst`eme de positionnement des electrodes
qui est utilise traditionnellement lors des tests deffort. Ces tests consistent en lenregistrement dun ECG durant le deroulement dun exercice physique calibre. Ils ont pour

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

70

Fig. 3.1 Positionnement des electrodes dans lECG PEM 3D Vs. lECG standard 12D.
objectif de favoriser lapparition, en continu ou `a intervalles programmes, danomalies qui
habituellement ne surviennent qu`a leffort (maladie des art`eres coronaires). Pour ce type
de tests, un positionnement des electrodes de facon traditionnelle (12 derivations) est
inadequat `a cause du bruit musculaire des bras et des jambes (myogramme). Or, avec le
PEM, lutilisateur est amene `a enregistrer ses propres ECG et est donc amene `a bouger.
Do`
u linteret du syst`eme de Mason-Mikar pour le positionnement des electrodes du PEM.
Cette configuration a ete concue dans le cadre du projet EPI-MEDICS avec le quadruple objectif :
1. dutiliser un nombre minimal delectrodes facile `a placer, particuli`erement dans des
conditions dutilisation `a domicile, en selfcare, en ambulatoire ou en situations
durgence ;
2. de contenir suffisamment dinformations pour diagnostiquer les ischemies et les
arythmies ;
3. de minimiser le nombre de derivations de lECG 12D `a synthetiser (autrement dit
de constituer si possible un sous-ensemble de lECG 12D standard) ;
4. doptimiser la qualite de la synth`ese des derivations manquantes de lECG 12D.
Elle est basee sur une serie detudes dans le cadre du projet EPI-MEDICS qui ont
permis de demontrer [125] quune configuration pseudo-orthogonale de derivations basee
sur DI, DII et V2 ou sur DI, DII et V3 contient suffisamment dinformations spatiotemporelles pour diagnostiquer lischemie et larythmie si la prise de decision est basee sur des
methodes danalyse multivariee ou de soft computing telles que les reseaux de neurones. Il
a ete egalement demontre au cours du projet EPI-MEDICS [126], quen prenant les coef-

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

71

ficients de correlation entre les derivations enregistrees et synthetisees comme marqueurs


de la qualite de la reconstruction de lECG standard 12D, que les meilleurs sous-ensembles
de derivations semblent etre (DI, DII, V2), (DI, AVF, V2) et (DI, DII, V3) (tableau 3.1).
Mais du fait quil est plus facile de placer V2, le projet a choisi (DI, DII et V2) comme
meilleur sous-ensemble de derivations du PEM.
Tab. 3.1 Correlations moyennes (en pourcentage) entre les derivations dorigine et
les derivations synthetisees au moyen dun mod`ele de regression generique en fonction du
sous-ensemble de derivations ECG 12D utilisees comme entrees pour la synth`ese. Resultats
extraits de [119] portant sur un ensemble dapprentissage de 72 ECG 12D sans ensemble
de test independant.
Sous-ensemble
DI,DII,V1
DI,DII,V2
DI,DII,V3
DI,DII,V4
DI,DII,V5
DI,DII,V6
DI, AVF,V2

3.3

V1
99.5
98.8
96.2
93.7
95.6
99.4

V2
99.1
98.8
93.5
88.1
91.5
-

V3
98.2
99.2
98.1
93.3
92.9
99.1

V4
97.4
97.9
99,2
98.5
96.1
97.9

V5
99.1
99.1
99.2
99.6
99.0
99.1

V6
99.6
99.6
99.6
99.4
99.4
99.6

m
98.7
99.1
99.1
97.4
94.6
95.0
99.0

Approches conventionnelles

Dans la litterature scientifique, la reconstruction de lECG 12D `a partir dun sousensemble de derivations est generalement basee sur une matrice generique de coefficients
calcules `a partir dun ensemble dECG provenant de differents patients via des techniques
statistiques telles que la regression lineaire [127, 120, 128, 121]. En outre, differentes
etudes ont conclu que la reconstruction la plus fid`ele est realisee `a laide dune matrice de
coefficients specifiques derives des ECG du patient [121, 127].
Toutefois, la plupart des methodes developpees pour la synth`ese de lECG 12D ont
ete uniquement evaluees `a laide des crit`eres de qualite classique tels que les coefficients
de correlation ou lerreur quadratique moyenne RMS (Root Mean Square Error). . . et les
enregistrements ECG 12D qui ont servi `a levaluation des resultats etaient les memes que
ceux qui ont servi pour le calcul des coefficients de synth`ese (ensembles de test identiques
aux ensembles dapprentissage). Tr`es peu detudes ont essaye devaluer levolution de la
qualite de la reconstruction de lECG dans le temps, o`
u le bruit ou les artefacts causes par
des electrodes mal placees ou les interferences avec dautres appareils. . . , sont susceptibles
de produire une difference significative entre les ECG et par la suite empecher une bonne
qualite de synth`ese. En effet, dans le meilleur des cas, la validation a ete effectuee sur
des ECG enregistres au maximum 24h apr`es le recueil des ECG sur lesquels le mod`ele de
synth`ese a ete parametre et en conservant la meme position des electrodes [119].

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

72

Enfin, `a notre connaissance, aucune etude na tente de realiser une evaluation plus
poussee de la qualite de la synth`ese en utilisant des descripteurs syntaxiques familiers
aux cliniciens tels que la presence ou labsence dune onde Q, le rapport de R/S. . . ou
en testant limpact de la reconstruction au niveau diagnostique et decisionnel. Il faut en
effet rappeler quen routine clinique le diagnostic electrocardiologique est base de facon
universelle sur des valeurs de param`etres damplitudes et de durees des differentes ondes
dans des combinaisons de sous-ensembles de derivations parmi les 12, en fonction des
types de pathologie. Il est donc tr`es important de pouvoir reconstruire un ECG 12D
standard `a partir de lECG PEM 3D afin que ce dernier puisse etre conserve dans le
dossier patient comme un ECG de reference si necessaire. En outre, la grande majorite
des logiciels danalyse automatique de lECG traitant lECG 12D, la reconstruction de
lECG PEM en ECG 12D autorisera son reanalyse eventuelle par dautres programmes.

3.4

Choix m
ethodologiques

Comme le PEM est prevu pour etre utilise `a grande echelle et sur le long terme
comme outil daccompagnement quotidien, il fallait tenir compte de ces contraintes en
developpant des methodes de synth`ese performantes capable de sadapter `a la variabilite
de jour en jour de lECG.
Cependant, si toutes les methodes utilisees pour la synth`ese de lECG sont basees sur
la regression lineaire, avec une qualite de synth`ese acceptable sur des ECG similaires,
aucune de ces methodes na ete evaluee sur des ECG enregistres dans des conditions
reelles avec le risque de bruit ou dartefacts. Dans de telles conditions, les methodes non
lineaires telles que les reseaux de neurones artificiels (ANN, artificial neural networks)
nous semblaient susceptibles de compenser les faiblesses des methodes lineaires. En effet,
la litterature scientifique est pleine dexemples dans dautres domaines dapplication o`
u
les approches non lineaires ont represente une alternative plus efficace que les approches
dites classiques [129, 130].
De meme, les reseaux de neurones, mis `a part leur utilisation comme classifieurs universels, grace `a leurs capacites dapprentissage, sont un outil interessant pour lapproximation de fonctions complexes. Plusieurs etudes [131, 132, 133] ont etabli que les reseaux
de neurones multicouches standards avec seulement une couche cachee sont capables dapproximer nimporte quelle fonction, si suffisamment de neurones caches sont disponibles.
Dans ce sens, les reseaux de neurones sont une classe dapproximateurs universels.
Cest pour ces raisons que jai developpe une methode originale de synth`ese de lECG
12D basee sur lutilisation des reseaux de neurones artificiels. La methode a deux versions :
une version generique et une version specifique. La version generique a pour objectif de
calculer des coefficients de synth`ese etablis `a partir de bases de donnees dECG standard
12D. Cette matrice de transformation generique peut etre integree dans le module de
synth`ese dECG du PEM lors de linitialisation de loutil.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

73

Toutefois, contrairement `a la tr`es grande diversite morphologique des ECG interindividus en fonction de lage et du sexe au sein dune meme categorie diagnostique
[134], leur tr`es nette stabilite au cours du temps chez le meme sujet en labsence de nouvelles cardiopathies [135] sugg`ere de fait que la qualite de la reconstruction pourrait etre
amelioree par lutilisation dune matrice de transformation specifique `a chaque individu.
La version specifique permet ainsi dobtenir des coefficients de synth`ese personnalises `a
lutilisateur du PEM. Cela necessite de disposer dau moins un ECG standard 12D de
reference pour le patient en plus de lECG PEM afin detablir la matrice specifique du
patient. Idealement, lECG 12D de reference et lECG PEM devraient etre acquis simultanement pour saffranchir de la variabilite naturelle dun ECG `a lautre.
De plus, pour pouvoir tester la qualite de la synth`ese sur des ECG autres que ceux
qui ont servi pour lapprentissage il faut disposer, pour chaque patient, dau moins un
deuxi`eme ECG 12D standard et, dune mani`ere generale, de bases de donnees dECG
seriels. Ces bases de donnees seront decrites dans la prochaine section.

3.5

Bases de donn
ees dapprentissage et de test

Pour elaborer et valider nos methodes de synth`ese des ECG 12D, nous avons utilise
deux bases de donnees. La premi`ere est la base de donnees ECG de Lund, dej`a decrite
dans le chapitre 2. La deuxi`eme est une base de donnees composee dECG enregistres sur
des patients hospitalises au service des soins intensifs de lhopital cardiologique de Lyon
[136], identifiee durant le projet EPI-MEDICS sous le nom de la base de donnees CHDB
(Cardiology Hospital in-patients Database).
La base de donnees CHDB contient un total de 386 ECG 3D PEM et de 316
ECG 12D standard enregistres par deux techniciens `a moins dune demi-heure dintervalle entre les deux ECG. Lenregistrement est dune duree de 10 sec, avec une
frequence dechantillonnage de 500 Herz. Les ECG 12D ont ete enregistres par un
electrocardiographe numerique standard (CardietteTM ). 50 ECG standard ont ete exclus
parce quaucun ECG PEM na ete enregistre dans un intervalle de temps raisonnable. De
meme, 20 ECG PEM ont ete exclus parce quaucun ECG 12D na ete enregistre sur ces
patients pendant la meme periode. Parmi les 266 paires restantes dECG enregistres sur
les memes patients, 6 paires ont ete exclues parce que les patients avaient un stimulateur
cardiaque et 65 paires dECG ont ete exclues parce que les traces etaient de tr`es mauvaise
qualite. La population detude issue de la base de donnees CHDB consiste finalement
en une serie de 195 paires dECG recueillis sur 131 patients. 85 paires dECG ont ete
enregistrees par le premier technicien et les 110 autres paires par le deuxi`eme technicien.
Les ECG ont ete traites par le programme de Lyon [24] afin dextraire de lenregistrement de 10 sec dorigine, un complexe P-QRS-T type dune duree d1 sec representatif de
lenregistrement de 10 sec. De meme, le programme de Lyon a ete utilise pour determiner
le debut et la fin des ondes P, QRS et T.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.6

74

Configuration du mod`
ele de synth`
ese de lECG
standard 12D par r
eseaux de neurones

Lobjectif de cette section est de presenter notre methode originale de synth`ese de


lECG standard 12D `a partir de lECG PEM 3D mettant en uvre des comites de reseaux
de neurones artificiels. Pour construire les reseaux de neurones, un indispensable prealable
est de bien selectionner les echantillons de donnees qui serviront aux apprentissages et aux
validations. Puis nous decrirons larchitecture des reseaux de neurones qui seront utilises
pour la synth`ese de lECG standard et la methode utilisee pour configurer leur structure.
Enfin, nous validerons la configuration retenue sur des ECG seriels extraits de la base de
donnees de Lund.

3.6.1

Constitution des ensembles dapprentissage et de test

` partir de la base de donnees de Lund, jai extrait, par selection aleatoire, un premier
A
sous-ensemble de 100 patients appele DS1. Le sous-ensemble DS1 servira `a determiner
la meilleure configuration de larchitecture des reseaux de neurones. Deux autres sousensembles de donnees, DS2 et DS3, de 100 patients chacun, seront utilises pour evaluer la
qualite de synth`ese des reseaux de neurones. Le sous-ensemble DS2, lui aussi obtenu par
tirage aleatoire, permettra de tester notre methode sur des patients selectionnes de facon
aleatoire, ce qui sous-entend quils sont susceptibles de presenter, en termes devolution,
une grande variabilite intra-patients due `a de possibles changements diagnostiques, `a des
electrodes mal placees, `a une inversion delectrodes. . . entre lECG de reference et lECG
durgence. Le sous-ensemble DS3 est constitue de 100 patients qui nont pas montre de
changements seriels significatifs sur leur 2`eme ECG suivant la methode danalyse serielle
CAVIAR [26]. Le sous-ensemble DS3 permet donc de tester notre methode de synth`ese
sur des ECG dont on a verifie quils nont pas devolution diagnostique significative ou
dinversion delectrodes.
La population detude est ainsi composee de 300 paires dECG provenant de 112
hommes et 188 femmes, avec un age moyen de 79 ans (40-96 ans), enregistres en moyenne
`a un an dintervalle (0-64 mois).

3.6.2

Evaluation de la variation naturelle intra-patients entre


les ECG de r
ef
erence et les ECG durgence

Nos trois sous-ensembles DS1-3 sont constitues dECG seriels enregistres en moyenne
`a un an dintervalle. Il pourrait donc y avoir de grandes differences entre les deux ECG.
Il est donc necessaire de verifier si la difference entre les ECG de reference et les ECG

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

75

durgence nest pas trop grande pour ne pas affecter outre mesure la qualite de la synth`ese.
On effectue donc un controle de coherence en calculant, pour chacun des 300 patients,
les coefficients de correlation entre les derivations DI, DII, V1, V2. . . V6 du premier et
deuxi`eme ECG.

3.6.3

Configuration de la structure des r


eseaux de neurones

Le probl`eme de la synth`ese des 5 derivations (V1, V3, V4, V5, V6) manquantes `a
partir du sous-ensemble des 3 derivations (DI, DII, V2) est un probl`eme dapproximation
de fonction. Or de nombreux travaux de recherche ont montre que les reseaux de neurones
[131, 132, 133], et en particulier les reseaux de type perceptron multicouches, constituent
un outil de choix pour resoudre ce probl`eme dapproximation. Deux solutions sont alors
envisageables : soit utiliser autant de reseaux que de signaux `a generer (Figure 3.2(a)),
soit dutiliser un seul reseau `a 5 sorties (Figure 3.2(b)). Notre choix sest porte vers la
solution presentee dans la figure 3.2(b). Ce choix est justifie par les raisons suivantes :
1. Sur le plan theorique : Combiner lapproximation des derivations V1, V3. . . V6 (sortie du reseau) `a partir des derivations DI, DII et V2 dans un seul et unique reseau
apporte davantage de richesse au niveau du jeu de donnees, au niveau de la combinaison de ces donnees et aura un impact positif sur la configuration des neurones
de la (des) couche(s) cachee(s). En plus, le fait quil y a une forte correlation entre
les derivations spatialement adjacentes (V1-V2, V2-V3, V3-V4,. . . ) confortee par le
fait que les cardiologues, en analysant lECG, analysent les derivations par paires
ou par triplets, justifie le choix de combiner les donnees dans un reseau global.
2. Sur la plan experimental : Une serie de tests prealables nous a permis de confirmer
le constat que le reseau global est meilleur que les 5 reseaux individuels.
Chaque reseau individuel consiste en une couche dentree de 3 neurones (un pour
chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal
derive), et h couches cachees de n neurones (Figure 3.3).
Par ailleurs, il convient de noter que la solution de la synth`ese des fonctions V1,
V3. . . V6 au moyen dun reseau multicouches est tributaire `a la fois du choix de larchitecture du reseau et de la selection initiale des poids et des biais. Larchitecture sera definie
de mani`ere experimentale au moyen dune serie de tests o`
u lon fera varier le nombre de
couches cachees (h=1, 2), le nombre de neurones par couche cachee (n=3, 5, 8, 10, 15),
et les fonctions dactivation pour les neurones des couches cachees (lineaire ou sigmode).
Concernant la couche de sortie, notre choix sest porte sur des fonctions dactivation
lineaire, `a la fois sur la base de considerations theoriques (les relations Vi = f (DI, DII, V2)
sont quasi-lineaires, les signaux sont damplitude crete `a crete variable, et peuvent etre
positifs ou negatifs), quau vu des resultats de la revue de la litterature qui indique que
les meilleurs resultats de lapproximation de fonctions au moyen de reseaux de neurones
sobtiennent generalement en utilisant des fonctions dactivation lineaire.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

(a)

76

(b)

Fig. 3.2 Differents types de mod`eles de synth`ese de lECG 12D `a partir dun sousensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et 1 sortie ; (b)
reseau global avec 3 entrees, 5 sorties.

Pour depasser les limitations de performance inherents au processus dapprentissage


des reseaux de neurones tel que la selection des param`etres initiaux des reseaux, nous avons
comme dans le chapitre precedent, adopte une approche multi-experts, multi-classifieurs
qui consiste `a utiliser des comites de N=50 reseaux de neurones artificiels. La sortie du
comite de reseaux de neurones est obtenue en moyennant les sorties des reseaux individuels.
Lobjectif est ici encore, de beneficier des resultats de lapplication du theor`eme central
limite en combinant les sorties des 50 reseaux individuels pour gommer les differences
globales et dobtenir des performances en termes de qualite de synth`ese sensiblement
meilleures que pour chacun des reseaux pris individuellement.

3.6.4

Processus dapprentissage et d
evaluation

Idealement, pour effectuer lapprentissage, nous aurions besoin dau moins 3 ECG
seriels par patient pour deriver un comite de reseaux de neurones specifique au patient :
un premier ECG pour effectuer lapprentissage du reseau, un deuxi`eme pour stopper
lapprentissage afin deviter le surapprentissage, et un dernier pour evaluer la capacite de
generalisation du comite. Malheureusement, les bases de donnees `a notre disposition ne
comportent pas plus de deux ECG seriels par patient. Pour surmonter cette difficulte, jai
adopte une strategie en deux temps qui consiste tout dabord `a determiner la structure
ideale des reseaux de neurones individuels et le nombre moyen diterations K sur un
ensemble dapprentissage (en fait DS1), puis `a evaluer les performances de cette structure

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

77

Fig. 3.3 Illustration de la structure individuelle des reseaux de neurones utilises pour
la synth`ese de lECG 12D : une couche dentree de 3 neurones (DI, DII, V2), une couche
de sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachees de n neurones.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

78

ideale sur les deux ensembles de test DS2 et DS3 en stoppant lapprentissage des reseaux
de neurones specifiques au patient au bout dun nombre diterations fixe egal `a K.
1. Configuration des comites de reseaux de neurones : Comme indique ci-avant, on
utilise le sous-ensemble DS1 pour determiner la meilleure structure des reseaux du
comite et pour calculer le nombre fixe diterations K `a employer. Le processus est le
suivant : On realise, pour chaque patient de DS1 et pour chacun des N=50 reseaux
du comite de reseaux de neurones, un apprentissage sur lECG de reference du
patient. Lapprentissage est arrete lorsque la mesure derreur sur lECG de test (ECG
durgence) du patient commence `a crotre. Ce processus est repete pour chacun
des hnt structures (h=nombre de couches cachees ; n=nombre de neurones par
couche ; t=type des fonctions dactivation). La meilleure configuration est celle
qui affiche la plus faible erreur de reconstruction moyenne sur lensemble des 100
ECG test de DS1. Le nombre diterations K est determine en calculant, pour chaque
patient, la moyenne du nombre maximum des iterations pour chacun des 50 reseaux
individuels et en faisant la moyenne de ces valeurs sur les 100 patients du sousensemble DS1.
2. Verification et validation : Le but de cette deuxi`eme etape est de verifier si la
configuration des reseaux (architecture et nombre fixe diterations K) determinee
lors de letape precedente est performante sur dautres sous-ensembles dECG, en
loccurrence, DS2 et DS3. Elle consiste `a determiner, pour chaque patient, un comite
specifique de 50 ANN en utilisant les signaux de lECG de reference du patient
comme ensemble dapprentissage. La structure de chaque ANN est celle determinee
lors de letape precedente et le nombre diterations utilise pour lapprentissage est
fixe egal `a K.
Les comites de reseaux de neurones elabores sur les ECG de reference des patients de
DS2 et DS3 sont ensuite utilises pour synthetiser `a partir des signaux DI, DII et V2
des ECG de test de DS2 et DS3, les signaux V1, V3. . . V6 supposes manquants. Ces
ECG synthetises sont ensuite compares aux ECG originaux `a laide dune analyse
quantitative qui consiste `a :
(a) Calculer lerreur quadratique moyenne RMS (Root Mean Square) et le coefficient de correlation entre les derivations originales et celles synthetisees sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris).
(b) Comparer ces valeurs par rapport `a celles obtenues en utilisant un mod`ele de
regression multiple specifique du type :
Vi = ai0 + ai1 DI + ai2 DII + ai3 V 2

(3.1)

o`
u aij sont les coefficients specifiques calcules `a partir des ECG de reference.
(c) Exclure, pour chacune des 2 methodes et pour chaque derivation, 5% des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.
Cette etape est prevue pour eviter tout biais produit par les cas extremes sur
le calcul des ecarts type et des moyennes [137].
(d) Effectuer des tests statistiques (paired et trimmed paired t-tests) pour verifier si
les differences observees entre les comites de reseaux de neurones et les mod`eles
de regression multiple sont statistiquement significatives.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.6.5

79

R
esultats

Evaluation de la variabilit
e naturelle intra-patients entre les ECG de r
ef
erence
et les ECG durgence originaux
Le tableau 3.2 illustre les valeurs des erreurs RMS entre le premier et le deuxi`eme
ECG des sous-ensembles DS1, DS2 et DS3. La valeur moyenne de lerreur RMS sur la
totalite du trace d1 sec (onde P, complexe QRS et onde T compris) pour les derivations
DI, DII, V1, V2, V3, V4, V5, V6 est de 140 V pour DS1, 149 V pour DS2 et 113 V
pour DS3. Ces chiffres illustrent une variabilite intra-patients entre les ECG de reference
et les ECG durgence plus importante pour les sous-ensembles DS1 et DS2 par rapport `a
DS3, ce qui pourrait avoir un effet sur la qualite de synth`ese. Ceci sera confirme dans la
partie consacree `a levaluation quantitative.
Tab. 3.2 Erreur quadratique moyenne (RMS) en V entre les derivations DI, DII, V1,
V2, V3, V4, V5 et V6 des ECG de reference et ECG durgence des sous ensembles DS1,
DS2 et DS3, apr`es exclusion des 5 valeurs les plus extremes.
D
erivation
DI
DII
V1
V2
V3
V4
V5
V6
RMS moyenne

DS1 (N=95)
85
95
107
194
197
176
149
115
140

DS2 (N=95)
85
84
107
168
219
216
180
134
149

DS3 (N=95)
68
80
86
143
151
145
129
98
113

Meilleure configuration des r


eseaux de neurones : architecture et nombre
moyen dit
erations
La determination de la meilleure configuration dun reseau de neurones est un
probl`eme difficile. De nombreux param`etres entrent en jeu : type de reseau, nombre de
couches cachees (h), nombre de neurones par couche (n), type des fonctions dactivation,
algorithme dapprentissage utilise, crit`ere de mesure de la qualite du reseau.
Le type de reseau (perceptron multi-couches avec 3 entrees et 5 sorties) et le type
de la fonction dactivation de la couche de sortie (fonction lineaire) ont ete fixes dans la
section 3 sur la base de considerations theoriques et pratiques. Concernant lalgorithme
dapprentissage, nous avons choisi une des variantes de lalgorithme de retropropagation

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

80

fournies par Matlab adapte `a lapproximation de fonctions. Il sagit de lalgorithme de


descente de gradient conjugue (scaled conjugate gradient algorithm, SCG) [138]. Enfin,
concernant le crit`ere de qualite, nous avons opte pour la mesure de lerreur quadratique
moyenne (RMS) entre les sorties de chaque reseau de neurones et les signaux correspondants reels provenant des enregistrements ECG durgence de DS1. Dautres crit`eres de
qualite auraient ete possibles (mesure de la qualite diagnostique du signal reconstruit,
differences de signaux en valeur absolue, . . . ), mais ont ete juges trop complexes `a mettre
en uvre dans cette etape preliminaire de determination de la meilleure configuration
possible des reseaux de neurones.
La meilleure configuration ANN est determinee experimentalement en effectuant lapprentissage des hnt structures differentes obtenues en faisant varier le nombre de
couches cachees (h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type
de fonction dactivation (t=lineaire, sigmode : tangente sigmode (tansig), logarithmesigmode (logsig)). La fonction dactivation utilisee dans la couche de sortie est lineaire.
Les meilleurs resultats ont ete obtenus pour h=1 couche cachee de n=15 neurones, une
fonction dactivation de type tangente sigmode et K=75 iterations. Les resultats detailles
des performances des hnt structures en termes derreur RMS sur les ECG durgence
de DS1 sont presentes en annexe C.

Evaluation quantitative de la qualit


e de la reconstruction
Pour evaluer quantitativement la qualite de la reconstruction par les reseaux de neurones des 5 derivations ECG (V1, V3,. . . V6) synthetisees `a partir des sous-ensembles (DI,
DII, V2) de lECG standard 12D et comparer les resultats avec ceux obtenus au moyen
dune methode de synth`ese basee sur la regression multiple, nous avons procede comme
suit :
Nous avons dabord commence par calculer lerreur quadratique moyenne RMS et
le coefficient de correlation (r) entre les derivations originales et celles synthetisees
par les reseaux de neurones. Les calculs sont effectues en considerant la totalite des
signaux `a notre disposition c.`a.d 1 sec de trace. Nous avons ensuite elimine les 5
cas les plus extremes et compare les valeurs RMS et r par rapport `a celles obtenues
avec la methode de regression multiple.
Nous avons enfin effectue des tests statistiques (paired et trimmed t-tests) pour
verifier si la difference observee entre les comites de reseaux de neurones et les
mod`eles de regression multiple est statistiquement significative.
Les resultats de levaluation quantitative de la performance des comites de reseaux de
neurones et des mod`eles de regression multiple en termes derreur RMS et coefficients de
correlation sont illustres dans le tableau 3.3. Ces resultats montrent la superiorite de la
synth`ese de lECG par reseaux de neurones avec une erreur RMS de 76 (DS1), 100 (DS2)
et 64 (DS3) V en moyenne et une correlation moyenne de 92% (DS1), 91% (DS2) et
97% (DS3) par rapport `a celle de la regression multiple avec une erreur RMS moyenne
de 83 (DS1), 108 (DS2), et 73 (DS3) V et une correlation moyenne de 91% (DS1), 90%

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

81

` noter que la performance est meilleure pour les ECG du sous(DS2) et 96% (DS3). A
ensemble DS3 par rapport `a ceux de DS1 et DS2. Cela montre quune grande partie de la
difference observee entre les derivations originales et celles synthetisees pourrait etre due
`a des electrodes mal placees ou `a un changement physiologique ou diagnostique de letat
du patient dans les sous-ensembles DS1 et DS2.
Le tableau 3.4 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 2 methodes. Dapr`es ces resultats, dans les deux approches de synth`ese,
la difference entre les reseaux de neurones et la regression multiple est statistiquement
significative (p0.001).
Tab. 3.3 Erreur quadratique moyenne (RMS) en V et coefficients de correlation (r)
entre les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S) sur
les ECG des sous-ensembles DS1, DS2 et DS3, apr`es elimination des 5 valeurs les plus
extremes.

A
N
N
S
R
E
G
S

D
erivation
V1
V3
V4
V5
V6
V1
V3
V4
V5
V6

DS1 (N=95)
RMS
r
62
.94
91
.91
92
.88
77
.92
59
.94
64
.93
99
.91
109
.87
85
.91
61
.94

DS2 (N=95)
RMS
r
68
.93
117
.88
127
.88
104
.92
83
.91
74
.93
123
.89
148
.86
112
.91
83
.91

DS3 (N=95)
RMS
r
48
.97
80
.95
80
.96
65
.97
48
.98
55
.96
84
.94
96
.95
76
.96
52
.98

Tab. 3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de la
difference en termes derreur RMS obtenue par les comites de reseaux de neurones et les
mod`eles de regression specifiques.
Sous-ensembles
DS1 (N=95)
DS2 (N=95)
DS3 (N=95)

Pairwised t-test
< 104
< 103
< 107

Trimmed t-test
< 105
< 105
< 109

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.6.6

82

Discussion

Il est toujours difficile de comparer des resultats devaluation dune nouvelle methode
telle que la methode de synth`ese des ECG par ANN `a ceux publies dans la litterature
lorsque les bases de donnees utilisees sont differentes. Les resultats vont dependre non
seulement du type de population et des cardiopathies, mais egalement des caracteristiques
techniques de lenregistrement des ECG et des mesures utilisees pour evaluer la qualite de la synth`ese. Ainsi les valeurs RMS seront fortement tributaires de la frequence
dechantillonnage et des intervalles ECG consideres. Les coefficients de correlation seront
maximum lorsque lon ne consid`ere que londe QRS, et seront plus faible lorsque lon prend
en compte la totalite des ondes P, QRS et T. Il est donc indispensable de confronter les
resultats dune nouvelle methode par rapport `a ceux obtenus avec une methode standard
en utilisant la meme base de donnees et les memes mesures de dissimilarite. Cest ce que
nous avons fait en comparant les resultats de notre methode de synth`ese par ANN avec
ceux obtenus en mettant en uvre sur les memes donnees une methode de synth`ese par
regression multiple.
Les chiffres les plus realistes publies dans la litterature mentionnent des coefficients de
correlation medians de respectivement r=0.978 pour des traces enregistres `a t=0 sec dintervalle (ie lensemble de test est le meme que lensemble dapprentissage) et r=0.953 pour
des enregistrements realises `a 24h dintervalle sans changement de position des electrodes
(methode de regression specifique, [119]). Les chiffres que nous avons obtenus sur DS2
sont de respectivement r=0.942 pour la regression lineaire et r=0.947 pour les comites de
reseaux dANN, sachant que, `a la difference des resultats publies par Nelwan et al [119],
nos resultats ont ete obtenus sur des traces enregistres en moyenne `a 1 an dintervalle et
en considerant 1 sec de traces (soit la totalite des intervalles P, QRS, T) au lieu du seul
intervalle QT.
Quoique non comparables `a cause de la nature des ECG de notre population detude,
nous estimons que les resultats que nous avons obtenus tant en termes de coefficients de
correlation moyens que derreurs RMS nous semblent suffisamment probants pour pouvoir
dire que la methode de synth`ese par comites de reseaux de neurones specifiques surpasse
tr`es nettement la methode de synth`ese par regression specifique et meriterait detre mise
en uvre en routine clinique.

3.6.7

Conclusion

La qualite de la reconstruction de lECG 12D par reseaux de neurones par rapport


`a lapproche classique de synth`ese par regression lineaire ma encourage `a continuer `a
effectuer une evaluation quantitative plus poussee de la qualite de synth`ese en estimant le
degre dalteration du diagnostic des ECG synthetises par rapport aux ECG de reference.
Dans cette perspective, jai realise une evaluation de lapproche de synth`ese par reseaux
de neurones dun point de vue decisionnel en utilisant une population detude composee

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

83

de plus de 800 paires dECG 12D classes soit dans la categorie apparition dun infarctus
aigue (AMI), soit dans la categorie controles extraits de la base de donnees de Lund. La
methode devaluation et les resultats sont presentes ci-apr`es en section 3.7.
Une autre etape est devaluer les potentialites de notre methode pour synthetiser
un ECG standard 12D `a partir de lECG 3D enregistre par le PEM. Cependant, pour
evaluer la qualite des synth`eses de lECG standard `a partir de lECG PEM, il faut disposer dune base de donnees regroupant `a la fois, et pour chaque patient, plusieurs paires
ECG PEM, ECG standard 12D chronologiquement homologues. Idealement chaque paire
dECG devrait etre enregistree de facon synchrone et serielle. Lacquisition des paires
dECG devrait etre effectuee `a plusieurs jours voire plusieurs mois dintervalle. Cela nous
permettrait deffectuer une evaluation, `a la fois en termes de similarite entre lECG 12D
synthetise `a partir de lECG PEM et lECG 12D original, et en termes de contenu diagnostique de lECG synthetise par rapport `a celui dorigine. Malheureusement `a ce jour,
nous ne disposons pas de telles bases de donnees. Pour circonvenir ce defaut, jai adopte
une approche alternative qui consiste en une evaluation sur un ensemble dECG de la
base de donnees CHDB.

3.7

Evaluation diagnostique sur la base de donn


ees
de Lund

Apr`es avoir teste dans la section precedente, `a laide de crit`eres traditionnels de qualite
(erreur quadratique moyenne RMS et coefficient de correlation), la capacite des reseaux
de neurones `a synthetiser lECG 12D `a partir dun sous-ensemble de derivations (DI, DII,
et V2), lobjectif de cette section est de presenter une evaluation de lapproche de synth`ese
par reseaux de neurones dun point de vue decisionnel en utilisant une population detude
extraite de la base de donnees de Lund et composee dECG dinfarctus et dECG de
controle. En dautres termes, il sagit dobserver limpact de la synth`ese sur linterpretation
de lECG derive par rapport `a celle obtenue sur lECG dorigine correspondant. Pour
cela, je me suis servi dun programme dinterpretation automatique developpe `a partir du
mod`ele presente dans le chapitre precedent (Figure 3.4) :
pour comparer le degre de concordance des interpretations realisees par le programme sur les ECG durgence reconstruits par rapport `a la verite clinique, i.e. la
categorie `a laquelle appartient lECG durgence dorigine,
pour mesurer la concordance entre les interpretations du programme sur les ECG
durgence reconstruits par rapport `a celles realisees sur les ECG durgence dorigine.
Dans le reste de cette section, nous allons dabord presenter les ensembles dapprentissage et de test que nous avons construit pour evaluer la methode de synth`ese par reseaux
de neurones. Ensuite, nous allons presenter les protocoles devaluation et enfin les resultats
des evaluations effectuees par rapport `a la regression multiple.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

84

Fig. 3.4 Programme dinterpretation automatique de lECG suivant 4 niveaux de risque.

3.7.1

Ensemble dapprentissage et ensemble de test

` partir de la base de donnees de Lund, jai extrait le meme sous-ensemble de test,


A
compose de 988 paires dECG (199 cas dAMI et 789 cas de controle) que celui utilise
pour tester la methode de diagnostic par reseaux de neurones developpee dans le chapitre
2. Ensuite, jai elimine toutes les paires dECG contenant des blocs (cest `a dire avec
une duree de londe QRS superieure `a 120 ms). Lensemble de donnees final est donc
compose de 808 paires dECG enregistres en moyenne `a un an dintervalle (0-7 ans),
provenant de 411 hommes et 397 femmes avec un age moyen de 71 ans (40-95 ans).
Parmi ces 808 patients, 151 ont developpe un infarctus aigue lors de leur admission dans
le service durgence et comme explique dans le chapitre 2, leur ECG durgence a ete
classe dans la categorie infarctus. En consequence, nous avons classe les 151 paires dECG
correspondants dans la categorie dinfarctus (AMI), et les 657 paires dECG restants dans
la categorie de controle. Dans la suite, nous appelons ensemble dapprentissage, lensemble
forme des 808 ECG de reference et ensemble de test, lensemble des 808 ECG durgence
correspondants.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.7.2

85

Configuration et apprentissage des comit


es de r
eseaux de
neurones sp
ecifiques aux patients

Pour synthetiser les derivations (V1, V3, V4, V5, V6) `a partir du sous-ensemble de
derivations (DI, DII, V2), jai utilise comme precedemment des comites de 50 reseaux de
neurones artificiels. Larchitecture de chaque reseau individuel, lalgorithme dapprentissage ainsi que le nombre diterations sont ceux decrits dans la section 3.6.
Pour chacun des 808 patients de la population detude, un comite de reseaux de neurones specifique au patient est calcule. Lapprentissage des reseaux est effectue sur lECG
de reference avec un nombre diterations fixe pour eviter le sur-apprentissage. LECG
durgence va ensuite servir pour evaluer la capacite de generalisation du comite.

3.7.3

Comparaison des interpr


etations automatiques des ECG
synth
etis
es par rapport `
a la v
erit
e clinique

Ce premier test a pour objectif devaluer la qualite de la synth`ese par comites de


reseaux de neurones et par regression en mesurant la concordance entre la verite clinique
des ECG originaux durgence et le diagnostic obtenu par application du programme dinterpretation automatique developpe dans le chapitre precedent. Le protocole devaluation
que nous avons mis en uvre commence par extraire les 808 ECG durgence classes en
deux categories : infarctus et controle de la base de donnees, puis `a creer les deux ECG de
synth`ese en appliquant tour `a tour les deux types de transformations specifiques, comites
de reseaux de neurones et regression multiple. Ensuite, la deuxi`eme etape est lapplication du logiciel de diagnostic sur les ECG generes par les methodes de synth`ese, ainsi que
sur les ECG originaux. Le programme classifie les ECG en 4 categories suivant le risque
dinfarctus : pas de risque, risque mineur, risque moyen et risque majeur. La troisi`eme
etape consiste `a combiner les ECG appartenant aux deux premi`eres categories : pas de
risque et risque mineur, et `a les considerer comme ECG de controle. De meme, les ECG
appartenant aux categories restantes : risque moyen et majeur, sont consideres comme
etant des ECG dinfarctus. La derni`ere etape est la comparaison de linterpretation automatique par rapport `a la verite clinique. Cette comparaison est realisee par le biais de
courbes ROC. Pour chacun des 2 ensembles dECG : ECG reconstruits par comites de
reseaux de neurones et ECG reconstruits par regression, une courbe ROC est calculee. Le
degre de concordance entre verite clinique et interpretation automatique est mesure par
laire sous la courbe ROC. Plus laire sous la courbe ROC est elevee, plus la methode de
synth`ese est performante.
La figure 3.5 illustre les courbes ROC resultant de la comparaison de linterpretation
automatique des 808 ECG durgence de la population detude reconstruits par reseaux
de neurones et par regression par rapport `a la verite clinique sur les ECG originaux.
La performance, mesuree par le biais de laire sous la courbe ROC, est respectivement

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

86

0.9

0.8

Sensibilit

0.7

0.6

0.5

0.4

0.3

0.2

Comit spcifique, aire = 0.862


Rgression spcifique, aire = 0.854

0.1

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Spcificit

Fig. 3.5 Courbes ROC resultant de la comparaison entre la classification des ECG
derives par reseaux de neurones et par regression, par rapport `a la verite clinique des
ECG originaux correspondants.
0.862 pour les ECG synthetises par reseaux de neurones et 0.854 pour ceux synthetises
par regression. Ces resultats sont remarquablement eleves car `a peine inferieurs `a ceux
obtenus sur les ECG originaux (aire de 0.872), avec un net avantage de la methode de
synth`ese par reseaux de neurones par rapport `a la regression.

Comparaison des interpr


etations automatiques des ECG synth
etis
es par rapport aux interpr
etations automatiques des ECG dorigine
Le deuxi`eme test devaluation de la qualite de la synth`ese par comites de reseaux
de neurones et par regression a pour objectif de mesurer la concordance entre les interpretations des ECG synthetises et les interpretations des ECG durgence originaux. Ce
test permettra de verifier si notre methode de synth`ese permet de reconstruire des ECG
renfermant suffisamment dinformation diagnostic pour que les logiciels dinterpretation
automatique fournissent des diagnostics concordant `a ceux qui seraient obtenus sur les
ECG originaux.
Le tableau 3.5 illustre les cas de concordance (elements sur la diagonale de la matrice
de confusion) et de discordance dinterpretation entre les ECG dorigine et les ECG derives
par reseaux de neurones et par regression.
Lanalyse des resultats nous apprend deux choses :
1. La qualite de synth`ese realisee par les comites de reseaux de neurones permet une

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

87

meilleure concordance dinterpretation entre ECG originaux et synthetises par rapport `a la performance realisee par la methode de regression.
2. Tous les elements de la matrice de confusion, en dehors de la tridiagonale, sont nuls
ce qui signifie que les interpretations entre lECG original et les ECG de synth`ese ne
different au maximum que de un degre dans lestimation de la qualite de lischemie,
et donc quil ny a pas de discordance sev`ere entre les interpretations. Le fait que
le diagnostic puisse passer dune categorie `a la categorie adjacente est dautant plus
probable que la sortie des ANN est proche des seuils de decision.
Tab. 3.5 Concordance entre les interpretations des ECG originaux et les interpretations
des ECG synthetises par reseaux de neurones (ANN-S) et par regression (REG-S). Le
logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de risque, risque
mineur, moyen et majeur.
Original
ANN-S
pas de risque (374)
risque mineur (209)
risque moyen (119)
risque majeur (106)
REG-S
pas de risque (379)
risque mineur (212)
risque moyen (113)
risque majeur (104)

3.7.4

pas de risque
(383)

risque mineur
(219)

risque moyen
(110)

risque majeur
(96)

351
32
0
0

22
160
36
1

1
17
76
16

0
0
7
89

350
32
1
0

29
158
32
0

0
22
73
15

0
0
7
89

Discussion & Conclusion

Apr`es avoir prouve au cours de la section 3.6 la faisabilite de lapproche de synth`ese de


lECG standard 12D `a partir dun sous-ensemble de derivations par le biais de comites de
reseaux de neurones, cette section vient renforcer les premi`eres constatations de lefficacite
de lapproche. En effet, la deuxi`eme phase devaluation exposee dans cette section a montre
que les comites de reseaux de neurones depassent en qualite de synth`ese les methodes
pronees par la litterature scientifique [121, 128], basees sur la regression multiple. De
plus, les ECG 12D derives `a partir du sous-ensemble de derivations : DI, DII et V2
contiennent suffisamment dinformation diagnostic et sont suffisamment similaires aux
ECG 12D dorigine pour permettre une concordance dinterpretation tr`es elevee. Encore
faut-il tester lefficacite de la methode `a synthetiser lECG standard 12D `a partir de lECG
3D enregistre par le PEM dEPI-MEDICS. Autrement dit, il sagit de prouver la capacite
de la methode des comites de reseaux de neurones `a synthetiser des ECG 12D `a partir
dECG 3D enregistres dans un contexte de telemedecine citoyenne. Ce sera lobjectif de
la prochaine et derni`ere etape de validation que nous presentons ci-apr`es.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.8

3.8.1

88

Evaluation de la qualit
e de la synth`
ese des ECG
standards 12D `
a partir des ECG 3D du PEM
Objectifs

Si linteret de notre approche de synth`ese dECG par reseaux de neurones est dej`a
prouve, letape logique suivante est devaluer la performance de la methode sur les ECG
3D du PEM enregistres `a plusieurs jours dintervalle, tenant compte des conditions dacquisition des ECG et dun minimum de variabilite de jour en jour de lECG. Rappelons
que le syst`eme dacquisition de lECG du PEM est base sur le positionnement de MasonLikar des derivations peripheriques DI et DII, et sur la derivation precordiale V2, et que
lutilisateur est amene `a enregistrer ses propres ECG et est donc amene `a bouger.
Levaluation de la qualite de la synth`ese de lECG standard 12D `a partir de lECG
PEM 3D sera effectuee sur un sous-ensemble dECG 12D et PEM 3D de la base de
donnees CHDB que nous decrirons dans la section suivante. Cette evaluation va consister
tout dabord `a utiliser des crit`eres traditionnels de qualite (erreur quadratique moyenne
RMS et coefficient de correlation) pour mesurer la capacite des reseaux de neurones `a
synthetiser lECG 12D `a partir dun sous-ensemble de derivations (DI, DII, et V2) du
PEM. Toutefois, la mise en uvre de cette approche nest pas simple. En effet, pour pallier
aux contraintes liees `a lutilisation de deux appareils differents (PEM pour les ECG 3D et
Cardiette pour les ECG 12D) pour enregistrer les ECG et au fait que lenregistrement des
deux ECG (12D et 3D) nest pas synchronise, il est indispensable de recourir dabord `a un
procede dalignement des signaux avant de pouvoir effectuer des mesures des differences
entre les derivations reconstruites et celles de reference. Ensuite, nous effectuons une
evaluation dun point de vue diagnostic pour tester limpact de la synth`ese sur la qualite
de linterpretation. Ceci sera realise en mesurant la concordance entre les interpretations
elaborees par le programme dinterpretation automatique, developpe dans le chapitre 2,
sur les ECG 12D reconstruits `a partir des ECG PEM 3D, et les interpretations realisees
sur les ECG Cardiette dorigine. Ces derni`eres sont considerees comme etant la verite.
De plus, par rapport aux sections precedentes, nous presenterons deux versions de
la methode de synth`ese : une version generique ayant pour objectif de calculer des coefficients de synth`ese etablis `a partir dun ensemble dECG standard 12D, ainsi quune
version specifique permettant dobtenir des coefficients de synth`ese personnalises `a lutilisateur du PEM `a partir de ses propres ECG. En effet, lors de la premi`ere utilisation du
PEM, il est probable que lon ne dispose pas encore de transformation specifique, et il est
donc important de savoir sil faut plutot utiliser une matrice de transformation generique
obtenue par regression multiple ou une methode de synth`ese basee sur des comites de
reseaux de neurones.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.8.2

89

Population d
etude

Pour constituer notre population detude, nous avons extrait de la base de donnees
CHDB une serie de paires dECG en appliquant un ensemble de r`egles decrites ci-apr`es.
Rappelons, en preambule, que la base de donnees CHDB contient, apr`es un premier
controle de qualite et de coherence, 195 paires dECG provenant de 131 patients. Chaque
patient poss`ede une, deux, voire plusieurs paires dECGs (Tableau 3.6). Chacune des
paires consiste en un ECG standard 12D et en un ECG PEM 3D base sur les derivations
DI, DII et V2.
Tab. 3.6 Description de la base de donnees CHDB.
195 paires dECG (3D et 12D) pour 131 patients
Nb de patients
Nb de paires par patient
83
1
36
2
9
3
2
4
1
5

Contr
ole de qualit
e et de coh
erence
Interpr
etation des ECG par des experts humains Chaque ECG 12D de la base de
donnees CHDB a ete interprete de mani`ere independante par un cardiologue experimente.
Chaque ECG a ete classe dans lune des deux categories suivantes :
1. ACS (Acute Coronary Syndrome), si un syndrome coronarien aigu (ACS) a ete
diagnostique sur lECG.
2. Controle, si lECG enregistre provenait dun patient pour lequel le diagnostic etait
autre que ACS.
Les 195 ECG standard 12D ont ete classes en respectivement 60 cas diagnostiques
ACS et 128 cas de controle. Les 7 cas restants nont pu etre diagnostique et ont
donc ete elimines de notre base de donnees.
A lissue de cette etape, notre ensemble de donnees est forme de 188 paires dECG provenant de 130 patients se repartissant ainsi :
1. 83 patients ont 1 paire dECG,
2. 39 patients ont 2 paires dECG,
3. 5 patients ont 3 paires dECG,
4. et 3 patients ont 4 paires dECG.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

90

Nous avons donc subdivise la base CHDB en deux sous-ensembles : SE1 est forme des
83 patients de la population detude ayant une seule paire dECG PEM 3D et Cardiette
12D et SE2 est forme des 47 patients ayant au moins deux paires dECG PEM et Cardiette.
Pour les 8 patients du sous-ensemble SE2 ayant plus de deux paires dECG, nous navons
retenu que les deux premi`eres paires dECG 3D et 12D `a condition quelles aient ete
enregistrees `a au moins 1 jour dintervalle. SE2 est donc constitue de 472 paires dECG
provenant de 47 patients. Les 94 paires dECG standard et les 94 paires dECG PEM ont
ete enregistres en moyenne `a 3 (1-21) jours dintervalle.

Processus de contr
ole de la coh
erence entre les ECG PEM et les ECG 12D
standards Du fait que lenregistrement des ECG nest pas synchrone et en raison du
statut cardiaque tr`es evolutif typique des patients dans un service de soins intensifs, il
pourrait y avoir de grandes differences entre les deux ECG PEM et 12D, souvent acquis `a
quelques dizaines de minutes dintervalle, et plus encore pour les cas de SE2, o`
u les deux
paires dECG ont ete enregistrees jusqu`a 3 jours dintervalle. Ces differences pourraient
affecter de mani`ere considerable la mesure des ecarts entre les ECG de synth`ese et les
ECG 12D dorigine, surtout en cas dapparition de troubles de la conduction ou du fait
de levolution dune ischemie aigue. Les differences imputables `a levolution de letat cardiaque pourraient en effet etre beaucoup plus importantes que celles dues aux algorithmes
de reconstruction des derivations manquantes.
Lobjectif de cette etape est donc de verifier si la difference entre les ECG PEM et Cardiette nest pas trop grande et deliminer les paires denregistrements dont les differences
depassent un certain seuil, pour eviter de fausser les mesures de la qualite de la synth`ese.
Le controle de coherence est effectue comme suit : pour chacun des 47 patients du sousensemble SE2, une analyse de correlation est effectuee entre les derivations DI, DII, V1,
V2. . . V6 du premier et deuxi`eme ECG Cardiette et entre les derivations DI, DII et V2
du premier ECG Cardiette et du deuxi`eme ECG PEM. Enfin, une troisi`eme et derni`ere
analyse de correlation est effectuee entre les derivations DI, DII et V2 du deuxi`eme ECG
Cardiette et de lECG PEM associe. Les traces sont juges coherents si aucun des coefficients de correlation entre deux derivations chronologiquement homologues nest inferieur
`a 0.2, seuil etabli de facon experimentale sur la base de donnees etudiee. A la suite de
cette etape, 10 patients ont ete elimines du sous-ensemble SE2. Lensemble de donnees
final consiste donc en une serie de (83+37) 157 paires dECG collectees sur 120 patients
(82 hommes, 38 femmes ; moyenne dage ecart type = 61 15 ans). Un syndrome coronarien aigu (ACS) a ete diagnostique sur 46 (29%) des 157 ECG standard 12D : (SE1 :
21 ECG ACS et 62 ECG de controle et SE2 : 25 ECG ACS et 49 ECG de controle).

3.8.3

Pr
etraitement des ECG

Pour aligner les traces ECG issus du PEM et des electrocardiographes 12D, nous avons
tout dabord aligne les debuts des QRS (determines par le programme de Lyon) des deux

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

91

traces puis nous avons evalue, au moyen dun algorithme de correlation croisee (cross
correlation) [139] le decalage entre les deux enregistrements en analysant les segments
allant du debut de londe Q jusqu`a la fin de londe T (QT) des derivations V2 des deux
signaux comme suit (Figure 3.6) :
Calcul de la correlation croisee dans lintervalle QT.
Estimation du decalage entre les deux signaux par la localisation de la valeur maximale de la fonction de correlation.
Utilisation du decalage calcule par correlation croisee pour aligner toutes les
derivations des ECG PEM et Cardiette.

3.8.4

Configuration de la structure des r


eseaux de neurones

Pour synthetiser les derivations (V1, V3, V4, V5, V6) `a partir du sous-ensemble
de derivations (DI, DII, V2) enregistrees par le PEM, nous avons utilise comme
precedemment un ensemble de comites de 50 reseaux de neurones artificiels constitues
de perceptrons multi-couches (PMC). Lapprentissage des PMC est effectue `a laide dun
algorithme de retropropagation supervisee (scaled conjugate gradient algorithm, SCG).
Chaque reseau consiste en une couche dentree de 3 neurones (un pour chaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signal derive), et 1 couche
cachee de 15 neurones. En dautres termes, il sagit de la meme configuration que celle que
nous avions obtenue lors de levaluation sur la base de donnees de Lund dans les sections
precedentes.

3.8.5

Processus dapprentissage
g
en
eriques

des

r
eseaux

de

neurones

Pour palier au fait que nous ne disposions que dun nombre restreint dECG standard
12D (83 ECG), nous avons adopte un processus dapprentissage du comite de reseaux
de neurones generiques mettant en uvre une technique de validation croisee (crossvalidation), dej`a expliquee dans le chapitre 2, comme suit : lensemble des 83 ECG 12D de
SE1 est divise en M=10 sous-ensembles egaux et disjoints. Ensuite, pour I = 1 `a M, chaque
reseau individuel du comite realise un apprentissage sur les M 1 sous-ensembles restant et
lerreur est calculee sur le sous-ensemble I, servant de validation. Les ECG des M 1 sousensembles sont juxtaposes pour former un enregistrement ECG artificiel continu. Larret
de lapprentissage est realise en surveillant lerreur de reconstruction (erreur quadratique
moyenne, RMS) sur le sous-ensemble restant I, o`
u les ECG ont ete egalement juxtaposes
pour former un enregistrement ECG continu. Le cycle dapprentissage est repete tant que
lerreur obtenue en sortie sur les donnees de lensemble de validation I est decroissante.
La procedure est repetee N fois pour chacun des reseaux du comite. Un nombre fixe
diterations K est alors determine en memorisant pour chacun des MN apprentissages le
nombre diterations et en calculant la moyenne de ces valeurs. Enfin, lapprentissage des

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

Fig. 3.6 Illustration de lalignement des signaux ECG par correlation croisee.

92

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

93

N=50 PMC est refait en utilisant la totalite de lensemble de donnees SE1 et en prenant
comme crit`ere darret le nombre fixe diterations calcule lors de letape precedente (Figure
3.7).

3.8.6

Processus dapprentissage
sp
ecifiques

des

r
eseaux

de

neurones

Comme dej`a indique plus haut, lideal serait davoir au moins 3 ECG seriels par patient
pour realiser un apprentissage specifique au patient. Or avec SE2, nous ne disposons au
maximum que de 2 enregistrements seriels par patient. Pour compenser ce manque de
donnees, nous avons adopte la meme strategie que pour la base de donnees de Lund
en utilisant comme crit`ere darret de lapprentissage un nombre fixe diterations K. En
pratique nous avons retenu la valeur de K que nous avons calcule sur les 83 ECG 12D de
SE1, soit K=56. Pour chacun des 37 patients du sous-ensemble SE2, nous avons configure
un comite de reseaux de neurones specifiques. Lapprentissage de chacun des N=50 reseaux
du comite est effectue sur le premier ECG 12D. Cet apprentissage est conditionne par le
nombre fixe diterations K.

3.8.7

V
erification et validation de la synth`
ese de lECG 12D

Pour verifier la capacite de generalisation des deux versions generique et specifique de


notre methode de synth`ese de lECG par comites de reseaux de neurones, nous avons teste
les deux types de comites sur la deuxi`eme paire dECG 12D et ECG PEM des 37 patients
du sous-ensemble SE2 (la deuxi`eme paire dECG par patient). Quatre synth`eses sont
realisees au total pour chacune des paires dECG en appliquant tour `a tour les comites de
reseaux de neurones generiques puis specifiques aux derivations DI, DII et V2 de lECG
Cardiette et de lECG PEM. La qualite de ces synth`eses sera evaluee `a deux niveaux :
1. Evaluation quantitative par mesures de similarite : il sagit devaluer la similarite
entre les signaux dorigine et ceux synthetises `a laide de mesures du type erreur
quadratique moyenne (RMS) et coefficient de correlation. Pour cette comparaison,
nous avons utilise lintervalle QT (en fait Q-onset -18 `a T-offset + 38 msec) de
lECG (Figure 3.8).
Les mesures derreur et de correlation obtenues sur les ECG synthetises par comites
de reseaux de neurones generiques et specifiques sont ensuite comparees par rapport `a celles obtenues en utilisant des mod`eles de regression multiple generiques et
specifiques. Ensuite, pour chacune des 4 methodes et pour chaque derivation, 5%
des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.
Enfin, deux tests statistiques, paired et trimmed paired t-tests, sont effectues pour
determiner si les differences enregistrees entre les deux approches sont statistiquement significatives.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

94

Fig. 3.7 Illustration de lapprentissage et de la validation des comites de reseaux de


neurones generiques et specifiques.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

95

Fig. 3.8 Visualisation des intervalles de temps utilises pour lapprentissage des comites
de reseaux de neurones generiques et specifiques (PT : P-Onset -18 `a T-offset +38 msec)
et pour tester leur capacite de generalisation (QT : Q-onset -18 `a T-offset +38 msec). En
cas dabsence de londe P, on remplace le pointeur P-onset par un pointeur virtuel tel que
lintervalle PQ correspondant `a lintervalle PQ moyen.
2. Evaluation diagnostique : lexactitude de la reconstruction de lECG 12D est evaluee
au niveau diagnostique en mesurant le degre de concordance entre les resultats
de linterpretation automatisee de lECG de reference et ceux obtenus sur lECG
synthetise. Cette interpretation est realisee de la meme facon que pour la base de
donnees de Lund en utilisant le programme de diagnostic developpe dans le chapitre
2 pour classer respectivement les ECG derives par voie generique et ceux generes
par voie specifique `a laide des comites de reseaux de neurones et des mod`eles de
regression multiple. Nous comparons ensuite les interpretations des ECG synthetises
au moyen des mod`eles de transformations generiques et specifiques aux resultats
de la stratification en deux groupes (controle et infarctus) des ECG de reference,
realisee par le meme programme que ci-dessus, resultat qui sera considere comme
etant la verite. La meilleure methode de synth`ese est celle qui fournit la meilleure
concordance.

3.8.8

R
esultats

Evaluation de la variabilit
e inter-patients naturelle des ECG
Le tableau 3.7 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier et le deuxi`eme ECG standards de SE2 enregistres `a 3 jours dintervalle
en moyenne en unite de soins coronariens. La valeur moyenne de lerreur RMS dans
lintervalle QT (Q-onset -18 `a T-offset +38 msec) pour les derivations DI, DII, V1, V2,

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

96

V3, V4, V5, V6 est de 106 V. Le coefficient de correlation est 0.92 en moyenne.
Les deux tableaux suivants presentent les resultats entre chacun de ces ECG Cardiette
et le deuxi`eme ECG PEM, afin dobserver une double confrontation.
Le tableau 3.8 illustre les valeurs des erreurs RMS et des coefficients de correlation
entre le premier ECG Cardiette et le deuxi`eme ECG PEM. La valeur moyenne de lerreur
RMS dans lintervalle QT pour les derivations DI, DII et V2 est de 107 V. Le coefficient
de correlation est de 0.87 en moyenne.
Enfin, le tableau 3.9 illustre les valeurs des erreurs RMS et des coefficients de
correlation entre le deuxi`eme ECG Cardiette et lECG PEM associe. La valeur moyenne
de lerreur RMS au niveau de lintervalle QT pour les derivations DI, DII et V2 est de 80
V. Le coefficient de correlation est 0.93 en moyenne.
Tab. 3.7 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre
les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxi`eme ECG
Cardiette du sous ensemble SE2, apr`es elimination des 5% des cas les plus extremes
(N=35).
Cardiette 1 vs Cardiette 2
D
erivation RMS ()
r ()
DI
60 ( 30)
.93 () 0.09
DII
73 ( 32)
.85 () 0.18
V2
125 ( 58) .95 () 0.07
V1
V3
V4
V5
V6

82 ( 44)
135 ( 57)
136 ( 56)
139 ( 59)
100 ( 41)

.95
.95
.92
.90
.91

()
()
()
()
()

0.08
0.04
0.08
0.13
0.10

Tab. 3.8 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations DI, DII et V2 du premier ECG Cardiette et du deuxi`eme ECG PEM du
sous ensemble SE2 (N=35).
Cardiette 1 vs PEM 2
D
erivation RMS ()
r ()
DI
93 ( 42)
.84 () 0.18
DII
98 ( 39)
.83 () 0.19
V2
130 ( 64) .94 () 0.07

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

97

Tab. 3.9 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations DI, DII et V2 du deuxi`eme ECG Cardiette et de lECG PEM associe du
sous ensemble SE2 (N=35).
Cardiette 2 vs PEM 2
D
erivation RMS ()
r ()
DI
78 ( 38)
.88 () 0.16
DII
74 ( 36)
.92 () 0.11
V2
87 ( 33)
.98 () 0.03

Ces resultats illustrent tout dabord la variabilite de jour en jour de lECG standard
12D (Cardiette 1 vs Cardiette 2). Cette variabilite est accentuee avec lintroduction du
positionnement Mason-Likar pour lECG PEM sur les derivations DI et DII (Cardiette
1 vs PEM 2). Ce double effet va avoir des consequences importantes sur la qualite de la
synth`ese de lECG standard.

Evaluation quantitative
D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII, V2)
de lECG Cardiette Les resultats de levaluation quantitative en termes derreur RMS
et coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees `a
partir de (DI, DII, V2) de lECG Cardiette 2 de SE2 en utilisant tour `a tour le comite de
reseaux de neurones et le mod`ele de regression generiques deduits `a partir des ECG 12D
de SE1 sont illustres dans le tableau 3.10. Ces resultats montrent une leg`ere superiorite de
la synth`ese des ECG par reseaux de neurones, avec une RMS moyenne de 122 V dans le
segment QT versus une RMS moyenne de 126 V pour la regression generique. Au niveau
de la correlation entre les derivations synthetisees et les derivations originales, les deux
methodes affichent une performance `a peu pr`es similaire avec une correlation moyenne de
0.93.
Levaluation quantitative des comites de reseaux de neurones et des mod`eles de
regression specifiques est illustree dans le tableau 3.11. Ces resultats montrent une assez
nette superiorite de la synth`ese dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 94 V dans lintervalle QT, par rapport `a la regression specifique avec une
RMS moyenne de 108 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese par reseaux de neurones specifiques affiche des
correlations superieures `a celles de la regression specifique avec des correlations moyennes
de respectivement 0.96 et 0.95 dans lintervalle QT.
Le tableau 3.12 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 4 methodes. Dapr`es ces resultats, seule lapproche de synth`ese specifique

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

98

Tab. 3.10 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations V1,V3. . . V6 originales et celles synthetisees par le comite de reseaux de
neurones generique (ANN-G) et le mod`ele de regression generique (REG-G) sur les ECG
2 du sous-ensemble SE2 (N=35).
V1, V3. . . V6 `
a partir de DI, DII et
M
ethode D
erivation RMS ()
A
V1
87 ( 42)
N
V3
108 ( 50)
N
V4
171 ( 77)
V5
152 ( 65)
G
V6
96 ( 44
R
V1
88 ( 42)
E
V3
111 ( 49)
G
V4
176 ( 73)
V5
157 ( 63)
G
V6
98 ( 45)

V2 Cardiette
r ()
.97 () 0.02
.97 () 0.03
.88 () 0.14
.91 () 0.09
.93 () 0.07
.97 () 0.02
.96 () 0.04
.88 () 0.09
.90 () 0.07
.92 () 0.08

Tab. 3.11 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux de
neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S) sur les
ECG du sous-ensemble SE2 (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 Cardiette
M
ethode D
erivation RMS ()
r ()
A
V1
68 ( 30)
.98 () 0.02
N
V3
93 ( 45)
.98 () 0.02
N
V4
114 ( 45)
.95 () 0.05

V5
112 ( 42)
.95 () 0.04
S
V6
84 ( 34)
.95 () 0.04
R
V1
75 ( 33)
.98 () 0.02
E
V3
99 ( 46)
.97 () 0.02
G
V4
140 ( 55)
.92 () 0.07
V5
132 ( 46)
.93 () 0.05
S
V6
93 ( 40)
.94 () 0.06
5
* p 0.01, ** p 10 (paired t-tests)

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

99

affiche une difference statistiquement significative (p< 106 ) entre les reseaux de neurones
et la regression multiple.
Tab. 3.12 Comparaison par les t-tests (pairwised et trimmed) de la difference en termes
derreurs RMS obtenues par les comites de reseaux de neurones et les mod`eles de regression
generiques et specifiques (N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S

0.236
< 106

0.066
< 107

D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII, V2)
de lECG PEM Les resultats de levaluation quantitative en termes derreur RMS et
coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees `a partir
de (DI, DII, V2) de lECG PEM 2 au moyen du comite de reseaux de neurones generique
et du mod`ele de regression generique derives comme precedemment `a partir des ECG
Cardiette de SE1, sont illustres dans le tableau 3.13. Ces resultats montrent une leg`ere
superiorite de la synth`ese dECG par reseaux de neurones generiques, avec une RMS
moyenne de 131 V dans lintervalle QT, par rapport la regression generique avec une
RMS moyenne de 134 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese dECG par reseaux de neurones generiques affiche
une superiorite plus nette avec une correlation moyenne de 0.92 dans lintervalle QT, par
rapport `a la regression generique avec une correlation moyenne de 0.90.
Levaluation quantitative des comites de reseaux de neurones specifiques et des mod`eles
de regression specifiques est illustree dans le tableau 3.14. Ces resultats montrent la
superiorite de la synth`ese dECG par reseaux de neurones specifiques, avec une RMS
moyenne de 118 V dans lintervalle QT, par rapport la regression specifique avec une
RMS moyenne de 126 V . Au niveau de la correlation entre les derivations synthetisees
et les derivations originales, la synth`ese par reseaux de neurones specifiques affiche une
correlation superieure `a celle de la regression specifique avec une correlation moyenne de
respectivement 0.93 et 0.92 dans lintervalle QT.
Le tableau 3.15 resume les resultats des tests statistiques effectues sur les valeurs des
erreurs RMS des 4 methodes. Dapr`es ces resultats, seule lapproche de synth`ese specifique
affiche une difference statistiquement significative (p< 0.05) entre les reseaux de neurones
et la regression multiple.
La qualite de la synth`ese affichee par notre approche de comites de reseaux de neurones ne semble pas etre globalement tr`es superieure `a celle de lapproche traditionnelle
de regression lineaire, en particulier au niveau generique. Cependant, vu le fait que dans
notre etude les ECG sont enregistres suivant deux syst`emes dacquisition differents :

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

100

Tab. 3.13 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations V1,V3. . . V6 originales des 2`eme ECG 12D de SE2 et celles synthetisees `a
partir des ECG PEM chronologiquement homologues par le comite de reseaux de neurones
generique (ANN-G) et le mod`ele de regression generique (REG-G) (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 PEM
M
ethode D
erivation RMS ()
r ()

A
V1
108 ( 49) .96 () 0.03
N
V3
120 ( 59) .96 () 0.03
N
V4
169 ( 72) .88 () 0.14
V5
156 ( 66) .89 () 0.09
G
V6
104 ( 40) .90 () 0.09
R
V1
113 ( 51) .95 () 0.03
E
V3
121 ( 62) .96 () 0.04
G
V4
172 ( 67) .88 () 0.11
V5
157 ( 64) .88 () 0.09
G
V6
105 ( 43) .89 () 0.09
* p 0.05 (paired t-test)

Tab. 3.14 Erreur quadratique moyenne (RMS) en V et coefficients de correlation entre


les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux de
neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S) sur les
ECG du sous-ensemble SE2 (N=35).
V1,V3. . . V6 `
a partir de DI, DII et V2 PEM
M
ethode D
erivation RMS ()
r ()

A
V1
90 ( 35)
.95 () 0.04
N
V3
120 ( 61) .97 () 0.02
N
V4
147 ( 69) .91 () 0.09
V5
132 ( 53) .92 () 0.05
S
V6
99 ( 43)
.91 () 0.09
R
V1
102 ( 42) .94 () 0.05
E
V3
110 ( 50) .96 () 0.03
G
V4
164 ( 72) .89 () 0.10
V5
150 ( 58) .90 () 0.07
S
V6
103 ( 47) .90 () 0.10
* p 0.01 (paired t-test)

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

101

positionnement standard pour lECG 12D et positionnement Mason Likar pour lECG
PEM et lintroduction dun dephasage d
u `a lasynchronisme existant entre les horloges
dechantillonnage des dispositifs denregistrement PEM et Cardiette, la difference devient
plus evidente. En effet, ces contraintes ont genere une difference moyenne en termes derreur RMS de 76 V et une correlation moyenne de 0.90 entre les derivations originales
DI et DII des ECG 12D et ECG 3D chronologiquement homologues (tableau 3.9). Leffet
Mason-Likar sur DI est plus important que la variabilite de jour en jour de lECG standard 12D (tableau 3.7). Par ailleurs, il convient de remarquer que les valeurs RMS et les
correlations des derivations V1, V3. . . V6 synthetisees par les comites ANN-S `a partir des
traces PEM 2 sont tout `a fait comparables `a celles mesurees entre les traces Cardiette
1 et Cardiette 2 (tableau 3.7). On peut donc penser que lon pourrait encore ameliorer
les resultats si lon construisait des reseaux specifiques sur des ECG 12D enregistres en
position Mason-Likar.
Tab. 3.15 Comparaison par les tests statistiques t-tests (pairwised et trimmed) de la
difference en termes derreurs RMS obtenues par les comites de reseaux de neurones et
les mod`eles de regression generiques et specifiques lorsque les entrees sont des ECG PEM
(N=35).
Pairwised t-test Trimmed t-test
M
ethodes
ANN-G vs REG-G
ANN-S vs REG-S

0.193
< 0.05

0.164
< 0.03

Evaluation diagnostique sur SE2


D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII,
V2) de lECG Cardiette 2 Le tableau 3.16 illustre le degre de concordance entre les
interpretations automatiques des ECG Cardiette originaux de SE2 (2`eme enregistrement)
et celles des ECG 12D synthetises par le comite de reseaux de neurones generiques et
par le mod`ele de regression multiple generique `a partir des derivations DI, DII et V2
de lECG Cardiette original lorsquon consid`ere linterpretation des ECG Cardiette 2
originaux comme etant la verite. De meme, le tableau 3.17 illustre le degre de concordance
entre linterpretation automatique des ECG Cardiette originaux et celle des ECG 12D
synthetises par les comites de reseaux de neurones specifiques et les mod`eles de regression
multiple specifiques.
Les resultats de levaluation de limpact de la synth`ese sur le contenu diagnostique de
lECG montrent une concordance globalement elevee entre les interpretations des ECG
synthetises et celles des ECG de reference. Les matrices de confusion sont quasiment
tridiagonales, `a lexception dun seul cas diagnostique respectivement comme presentant
un risque majeur sur lECG 12D dorigine et un risque mineur sur les ECG de synth`ese

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

102

sauf pour la synth`ese par regression specifique o`


u il est classe dans la categorie risque
moyen. 31 ECG de synth`ese sur 37 sont diagnostiques `a lidentique de lECG 12D original.
Sur les 6 cas restants, 5 se retrouvent dans des classes adjacentes de part et dautre de
la diagonale de la matrice de confusion. Cette tridiagonalite sexplique en partie par la
nature des r`egles daffectation `a une classe qui sont basees sur des seuils appliques `a la
sortie du comite de reseaux de neurones. Il suffit quun cas soit `a la limite du seuil de
decision pour quun epsilon de variation des traces, donc des param`etres, le fasse changer
dune categorie `a lautre. Par ailleurs, il convient de noter aussi que certains param`etres
de type syntaxique (tels que les amplitudes et les durees des ondes Q, R, S, R, S,. . . )
mesures sur lECG sont tr`es sensibles `a de petites variations. A titre dexemple, en cas
de presence dun morphotype de type QRS ou RS avec une toute petite onde R, une
tr`es faible modification de londe R ou du niveau de la ligne de base peut conduire `a des
modifications consequentes des param`etres mesures (Figure 3.9).
Comme dej`a evoque dans le chapitre 2, lintroduction de fonctions dappartenance
floue permettrait sans doute dattenuer ces changements intempestifs de categorie lies
aux seuils de decision utilises pour mesurer les param`etres ECG de nature syntaxique
(relatifs aux ondes Q, R, S,. . . ) ou pour categoriser un ECG en lune ou lautre des
classes de diagnostic.

(a)

(b)

Fig. 3.9 Incidence de la methode de synth`ese de lECG sur la calcul des param`etres
ECG de type syntaxique. A gauche sur lECG dorigine, le trace presente une petite onde
R et une grande onde S. A droite, sur lECG de synth`ese, aspect typique dit QS. Londe
R, microvoltee, na pas ete detectee et par consequent la duree de londe Q est passee de
0 `a 92 msec et celle de londe S de 70 msec `a 0.

D
erivations pr
ecordiales (V1, V3. . . V6) synth
etis
ees `
a partir de (DI, DII,
V2) de lECG PEM 2 Le tableau 3.18 illustre le degre de concordance entre les
interpretations automatiques des ECG Cardiette 2 Originaux et celles des ECG 12D
synthetises `a partir des derivations DI, DII et V2 de lECG PEM chronologiquement
homologue (ECG PEM 2) par le comite de reseaux de neurones generiques et le mod`ele
de regression multiple generique, linterpretation des ECG Cardiette 2 etant consideree
comme etant la verite. De meme, le tableau 3.19 illustre le degre de concordance entre
les interpretations automatiques des ECG Cardiette 2 originaux et celles des ECG 12D
synthetises par les comites de reseaux de neurones specifiques et les mod`eles de regression

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

103

Tab. 3.16 Concordance entre les interpretations des ECG originaux et celles de ECG
synthetises `a partir des derivations DI, DII et V2 de lECG 12D Cardiette 2 par le comite
de reseaux de neurones generiques (ANN-G) et par le mod`ele de regression generique
(REG-G). Le logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de
risque, risque mineur, moyen et majeur.
Original
ANN-G
pas de risque (8)
risque mineur (14)
risque moyen (6)
risque majeur (9)
REG-G
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)

pas de risque
(6)

risque mineur
(15)

risque moyen
(5)

risque majeur
(11)

6
0
0
0

2
13
0
0

0
0
4
1

0
1
2
8

5
1
0
0

2
13
0
0

0
0
4
1

0
1
1
9

Tab. 3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseaux
de neurones specifiques (ANN-S) et les mod`eles de regression specifiques (REG-S).
Original
ANN-S
pas de risque (7)
risque mineur (15)
risque moyen (5)
risque majeur (10)
REG-S
pas de risque (6)
risque mineur (16)
risque moyen (5)
risque majeur (10)

pas de risque
(6)

risque mineur
(15)

risque moyen
(5)

risque majeur
(11)

5
1
0
0

2
13
0
0

0
0
4
1

0
1
1
9

5
1
0
0

1
14
0
0

0
1
3
1

0
0
2
9

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

104

multiple specifiques.
Tab. 3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits `a
partir des derivations DI, DII et V2 de lECG PEM 2.
Original
ANN-G
pas de risque (5)
risque mineur (12)
risque moyen (13)
risque majeur (7)
REG-G
pas de risque (6)
risque mineur (13)
risque moyen (10)
risque majeur (8)

pas de risque
(6)

risque mineur
(15)

risque moyen
(5)

risque majeur
(11)

3
2
1
0

1
8
6
0

1
1
2
1

0
1
4
6

3
2
1
0

2
9
4
0

1
1
2
1

0
1
3
7

Bien que moins probants, ces resultats sont neanmoins satisfaisants car 34 cas sur
37 cas se retrouvent ici encore sur la tridiagonale de la matrice de confusion. Deux cas
supplementaires montrent un changement de categorie diagnostique qui va au del`a de la
categorie adjacente. Ainsi un cas passe de la categorie pas de risque `a la categorie risque
moyen, un autre passe de la categorie risque moyen `a la categorie pas de risque.
Comme pour levaluation quantitative, le fait davoir utilise des ECG enregistres `a
plusieurs minutes dintervalle avec deux syst`emes dacquisition differents, ie un positionnement des electrodes DI et DII standard pour lECG 12D et Mason Likar pour lECG
PEM 3D, parfois des electrodes mal-placees. . . a pu generer des differences importantes
entre les derivations originales DI et DII des ECG 12D et ECG 3D. Cette variabilite, tr`es
importante dans certains cas, a empeche une bonne qualite de synth`ese et a d
u alterer
le contenu diagnostique des ECG. Si lon prend comme crit`ere de qualite le pourcentage
de diagnostics sans changements de categorie (ie la somme des elements de la diagonale
des matrices de confusion divisee par le nombre total de cas analyses, soit 37), ANN-S
semble plus performant que REG-S, mais pas plus performant que ANN-G. De facon surprenante, la regression generique (REG-G) avec 21/37 classes `a lidentique, semble etre
la methode la plus performante. Ces resultats sont cependant `a prendre avec precaution
car avec seulement 37 cas, lensemble de test nest pas suffisamment representatif pour en
tirer des conclusions definitives.

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

105

Tab. 3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits `a
partir des derivations DI, DII et V2 de lECG PEM 2.
Original

pas de risque
(6)

risque mineur
(15)

risque moyen
(5)

risque majeur
(11)

4
1
1
0

2
6
7
0

1
1
2
1

0
1
3
7

4
1
1
0

3
4
8
0

1
1
2
1

0
1
3
7

ANN-S
pas de risque (7)
risque mineur (9)
risque moyen (13)
risque majeur (8)
REG-S
pas de risque (8)
risque mineur (7)
risque moyen (14)
risque majeur (8)

3.9

Discussion

Comme le demontre la figure 3.10, La qualite de reconstruction par notre methode


de synth`ese de lECG 12D par comites de reseaux de neurones artificiels specifiques est
excellente compte tenu du faible nombre de derivations qui ont servi pour realiser la
synth`ese et le fait que les ECG ont ete enregistres dans de vraies situations cliniques, par
des techniciens differents et avec diverses configurations de positionnement des electrodes.
En effet, les differences de similarite entre les ECG originaux et ceux synthetises se sont
averees principalement dues `a des electrodes mal placees ou explicables par les differences
de positionnement des electrodes peripheriques selon le syst`eme de recueil dit de MasonLikar versus des electrodes fixees aux extremites des membres et par consequent nont
pas perturbe le diagnostic dans la majorite des cas. Par ailleurs, malgre le fait quau
niveau generique, les reseaux de neurones nont pas depasse en performance la regression
multiple, nous croyons que notre approche peut etre optimisee en utilisant une base de
donnees dECG plus grande et plus representative lors de la phase dapprentissage.
De plus, la marge de progression reste consequente, tant au niveau des collectes dECG
plus adaptes (au moins 3 ECG seriels. . . ) que du pretraitement des donnees, de loptimisation de lapprentissage via des techniques dapprentissage selective [96], evolutive
[95]. . .

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

3.10

106

Conclusion

Dans ce chapitre, nous avons presente letude exhaustive dune methode originale
de synth`ese de lECG 12D par application de comites de reseaux de neurones artificiels
que jai developpe au cours de ma th`ese. Les evaluations quantitatives et cliniques de la
methode ont demontre son interet majeur dans le cadre dun scenario de telemedecine :
acquisition dun ECG simplifie `a domicile ou en ambulatoire, et generation de lECG
standard 12D correspondant.
Les performances enregistrees par la methode de reseaux de neurones sur des ECG
12D seriels ou des ECG 12D et ECG PEM enregistres dans des conditions simulant celles
dutilisation du PEM (cest `a dire en ambulatoire ou `a domicile, acquisition par le patient,
son entourage ou un/une aide soignant(e), avec un positionnement delectrodes different
de celui de lECG standard 12D), ont largement depasse les methodes conventionnelles
publiees dans la litterature. Les premiers resultats des experimentations de la methode
de synth`ese ont ete presentes lors de la conference internationale IEEE Computers in
Cardiology 2004 [140]. Un deuxi`eme article, sur levaluation sur la base de donnees CHDB,
a ete soumis pour publication `a la revue internationale Methods of Information in Medicine
[141], et un troisi`eme article est en cours de redaction.

107

V1

V3

V4

V5

V6

Chapitre 3. Acquisition de lECG PEM et synth`ese de lECG standard

REG G

REG S

Original

ANN S

ANN G

Fig. 3.10 Illustration de la qualite de synth`ese de lECG standard 12D `a partir de lECG
PEM 3D.

Chapitre 4
Mise en place de la plateforme
d
ecisionnelle du PEM
4.1

Objectifs

Dans ce chapitre, nous allons principalement exposer et traiter les probl`emes liees au
deploiement des methodes dintelligence artificielle abordees dans les precedents chapitres,
dans la plateforme logicielle du syst`eme.
Une premi`ere problematique est liee `a la creation des modules de calcul du risque
cardiovasculaire : il sagit du module neuronal dinterpretation de lECG PEM, du
module bayesien de quantification des facteurs de risque `a partir des donnees du
dossier medical de lutilisateur du PEM, et de la couche de collaboration entre les
deux modules suivant un syst`eme `a base de r`egles de logique floue.
Une deuxi`eme problematique est liee au deploiement du module de synth`ese de
lECG 12D `a partir de lECG PEM 3D enregistre par lutilisateur (citoyen/patient)
lui-meme, avec le minimum dassistance professionnelle.
Une troisi`eme problematique est de rendre laide `a la decision dans le syst`eme
adaptee `a la specificite de chaque utilisateur.
Les autres problematiques liees `a la generation dalarmes et de leur niveau, la gestion de
lenvoi des alarmes tenant compte des non-reponses eventuelles des serveurs dalarme ou
des professionnels de sante contactes. . . seront bri`evement abordes.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

4.2

109

Etat actuel de d
eveloppement du PEM `
a l
etape
de prototype

Quatre-vingt prototypes du PEM ont ete construits et evalues selon differents scenario
dutilisation dans differents centres, `a Lyon, Brescia, Catania, Lund et Trento, dans des
services durgence, des unites de soins intensifs, des cliniques de cardiologie, en medecine de
ville, au domicile du patient et en ambulatoire, par differents professionnels (cardiologues,
generalistes, techniciens ECG, infirmi`eres,. . . ) et par des patients eux-memes [7, 47].
Dans la suite de cette section, nous allons decrire les fonctionnalites et services disponibles dans le PEM `a letat actuel de developpement.

4.2.1

Le PEM : intelligence embarqu


ee dans un environnement
pervasif multi-acteurs de t
el
em
edecine citoyenne

Le projet EPI-MEDICS a developpe un PEM intelligent et pervasif pour la detection


precoce de la survenue devenements cardiovasculaires chez les patients et citoyens utilisateurs du syst`eme. La plateforme decisionnelle embarquee dans le PEM permet : la
detection des arythmies, le diagnostic des ischemies, la generation dalarmes, et la gestion intelligente des messages dalarmes de mani`ere `a assurer un acheminement securise
et dans les plus courts delais aux professionnels de sante appropries : SAMU, medecin
traitant. . . (Figure 4.1)

Fig. 4.1 Le PEM (Personal ECG monitor) au service de la prevention et la detection


precoce de la survenue devenements cardiovasculaires.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

4.2.2

110

Architecture pervasive g
en
erique

Pour permettre une communication pervasive entre les acteurs de lapplication (utilisateur du PEM, SAMU, cardiologue, etc.) communiquant `a laide de divers outils (PEM,
telephone portable, PDA, etc.), EPI-MEDICS a realise une architecture generique basee
sur les technologies dInternet (TCP/IP) et le meta-language XML pour la representation,
le stockage et la communication des donnees [6, 142].
Larchitecture pervasive dEPI-MEDICS (Figure 4.2) consiste en une application principale installee sur un serveur web dont le principal objectif est dassurer la gestion de
lechange des messages, et des applications clients distribuees, la communication etant
securisee grace au protocole HTTPS. Un message contient une partie liee `a la communication, une copie du dossier de sante electronique, et tout autre fichier attache tel quun
ECG au format SCP-ECG. Pour assurer la bonne reception de linformation dans un delai
acceptable, larchitecture permet dacheminer partout, differents types de notification par
le biais des divers moyens et technologies de communication de l`ere actuelle (Pager, SMS,
PDA, etc.).

Fig. 4.2 Un exemple darchitecture dEPI-MEDICS : un serveur web assure la gestion


intelligente des echanges de messages, et des applications clientes distribuees servant `a
envoyer et `a recevoir les demandes XML de tele-expertise via HTTPS.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

4.2.3

111

G
en
eration et gestion dalarmes

Differents niveaux dalarmes sont generes suivant la severite de levenement cardiaque :


alarmes majeure, moyenne, mineure, ou pas dalarme.
Les alarmes de niveau majeur (infarctus aigu, arythmies sev`eres) sont transmises au
SAMU ou `a lun des centres durgence identifies et stocke dans le PEM en utilisant
Bluetooth et GPRS via le telephone portable de lutilisateur (Figure 4.3). Sont transmis
en priorite :
1. un message dalarme indiquant la cause et le degre de gravite de lalarme ;
2. les donnees permettant didentifier et de localiser le patient ;
3. lECG qui a ete la cause de la generation de lalarme ;
4. le dossier medical du patient, notamment ses antecedents cardiaques et ses facteurs
de risque ;
5. lECG de reference (sil existe) ;
6. un descriptif des symptomes cliniques (si le patient a eu le temps de les documenter) ;
7. lECG precedant lECG anormal (si specifie par les param`etres denvoi du patient).

Fig. 4.3 Scenario dalarme majeure.


Dans le cas dune alarme de niveau moyen (suspicion dischemie, arythmie atypique),
lensemble des informations (ECG PEM et le dossier medical electronique embarque) est
envoye `a un serveur dalarmes (Figure 4.4) qui envoie d`es reception un SMS au medecin
traitant (cardiologue ou generaliste) identifie dans la liste des contacts du patient embarquee dans le PEM. Ce SMS indique la raison et limportance du niveau dalarme, le
numero du telephone portable du patient, ladresse du serveur dalarmes (couramment :
http ://pem-alarm.insa-lyon.fr ou http ://pemalarm. univ-lyon1.fr), un identifiant de 6
chiffres generes aleatoirement et un mot de passe choisi aleatoirement dans un dictionnaire de mots courants de 6 `a 8 caract`eres. Le medecin traitant peut alors se connecter
au serveur dalarmes au moyen dInternet, visualiser lensemble des informations disponibles pour ce patient au moyen dun simple browser Web, et prendre les decisions qui

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

112

simposent : contacter le patient, requalifier le niveau dalarme en alarme majeure en


demandant au serveur denvoyer lensemble des informations au SAMU, demander une
tele-expertise aupr`es dun confr`ere, copier le ou les ECGs stockes temporairement sur le
serveur dalarme dans le dossier medical du patient. . .

Fig. 4.4 Scenario dalarme moyenne.


Dans le cas dune alarme de niveau mineur, le PEM affiche un message invitant lutilisateur `a signaler ce message `a son medecin traitant `a loccasion dune prochaine visite `a
son cabinet. Le contenu du message est archive dans le PEM en meme temps que lECG
et les resultats de lanalyse quantitative et le medecin pourra par la suite telecharger et
visualiser lECG concerne.
Enfin, si la probabilite du risque cardiovasculaire nest pas significative, le PEM emet
un message reconfortant au patient : pas de risque, etat cardiaque normal.

4.2.4

D
etection des arythmies et des isch
emies

La detection des arythmies est basee sur un syst`eme `a base de r`egles de logique floue.
Le module dinterpretation du rythme cardiaque, concu mais pas encore implante dans le
PEM, calcule les variations de lECG PEM par rapport `a un ECG de reference. Suivant
la categorie auquel correspond lutilisateur du PEM, `a savoir, athl`ete professionnel1 , sujet
sain, sujet avec des antecedents darythmies dans le passe, sujet souffrant de probl`emes
cardiaques, le module applique une serie de r`egles standards utilisees pour detecter larythmie. Ces r`egles originalement faites en logique booleenne ont ete traduites en logique floue
1

Il est en effet connu que lECG dun sportif professionnel est tr`es different de lECG dun sujet de
meme age, du meme sexe et de meme categorie diagnostique mais non sportif. En particulier, le segment
ST peut presenter des decalages par rapport `a la ligne de base de lECG avoisinant les crit`eres dischemie
chez un sujet sain, sportif professionnel

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

113

pour permettre plus de flexibilite et sensibilite dans linterpretation.


La detection des ischemies est basee sur lutilisation de comites de reseaux de neurones
artificiels de respectivement 100 reseaux pour lanalyse unaire et 75 pour lanalyse serielle.
Lanalyse unaire nest invoquee que si aucun ECG de reference nest disponible. Les
reseaux de neurones sont representes suivant un format texte, developpe dans le cadre
dEPI-MEDICS. Ce format contient la description de tous les param`etres des reseaux de
neurones (poids, biais, fonctions dactivation) afin de rendre possible son deploiement.
Enfin, un logiciel, simulant le fonctionnement des reseaux de neurones, charge les reseaux
du comite, recup`ere les param`etres unaires/seriels et lance linterpretation de lECG PEM
[143].

4.2.5

Reconstruction de lECG standard 12D `


a partir de lECG
PEM 3D

Lors de lenregistrement dun ECG, le PEM peut detecter un disfonctionnement cardiaque et contacter un centre dappel (SAMU) ou un professionnel de sante (medecin
traitant). Comme nous lavons dej`a explique, le PEM est concu pour envoyer lECG responsable du declenchement de lalarme dans un format comprehensible et interpretable
par les cardiologues, `a savoir lECG standard 12D, encode suivant la norme SCP-ECG.
Pour assurer la reconstruction de lECG standard, un module de synth`ese, base une matrice de transformation generique, a ete embarque dans le PEM.
Au cours du projet EPI-MEDICS, diverses approches de synth`ese ont ete evaluees
ou developpees, dont notamment la methode de reconstruction par reseaux de neurones
que jai developpe et presente dans ce rapport de th`ese. Cette methode originale et tr`es
prometteuse a ete testee sous Matlab mais na pas encore ete implementee dans le PEM.
Une etude va etre menee pour determiner la meilleure strategie de deploiement, du fait du
co
ut de calcul que necessite lapprentissage de comites de reseaux de neurones `a grande
echelle (tous les futurs utilisateurs du PEM). Quelques reponses sont fournies dans la
suite de ce chapitre.

4.3

Vers un produit final : strat


egies de d
eploiement
du module de synth`
ese de lECG embarqu
e dans
le PEM

Dun point de vue technique, lintegration des technologies danalyse multivariee telles
que les reseaux de neurones dans un syst`eme daide `a la decision tel que le PEM pour
realiser un module de synth`ese de lECG tend `a etre co
uteux en termes despace memoire

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

114

et de temps de calcul, particuli`erement pendant la phase dapprentissage des reseaux


de neurones. Cependant, une fois le processus dapprentissage realise, la synth`ese dun
enregistrement ECG de 10 sec ne prend quenviron 5 sec sur un ordinateur Pentium IV
de 2 GHz sous Matlab. Cette duree de traitement sera alors encore bien reduite en phase
operationnelle en utilisant le langage C.
Dautres part, il faut savoir que lobjectif principal de la synth`ese dECG nest pas la
prise de decision dans le PEM mais plutot la reproduction la plus fid`ele possible dun ECG
12D correspondant `a lECG PEM critique afin de le rendre interpretable par le cardiologue
destinataire. Dans le PEM, la reconstruction des derivations (V1, V3, . . . V6) manquantes
permet de produire un enregistrement ECG compatible au standard SCP-ECG qui sera
stocke dans la carte memoire du PEM.
Deux types de solutions pourraient etre utilises pour realiser le module de synth`ese
de lECG par reseaux de neurones, suivant notre perception de loperabilite du PEM :
syst`eme compl`etement autonome ou semi autonome.

4.3.1

Le PEM, un dispositif autonome

La puissance de calcul de linformatique embarquee a progresse enormement cette


derni`ere decennie approchant aujourdhui les capacites de calcul dun Pentium III de
800 MHz. Ce potentiel de calcul pourrait nous permettre de doter le PEM dun moteur
dapprentissage des reseaux de neurones. Ce moteur utiliserait les bases de donnees dECG
propre `a lutilisateur du syst`eme pour mettre `a jour le jeu de param`etres des comites de
reseaux de neurones specifiques.

4.3.2

Le PEM, un dispositif semi-autonome

Bien que le choix dun dispositif compl`etement autonome semble etre seduisant, une
etude de linteret de lintroduction de telles puissances de calcul et surtout de son impact
au niveau du prix unitaire de lappareil, devrait etre effectuee.
Une solution moins co
uteuse et plus facilement evolutive au niveau materiel mais qui
peut etre plus compliquee `a mettre en place du point de vue logiciel, consiste `a se servir
des moyens de communication integres dans le PEM (Blue Tooth, GPRS, serveur web
. . . ) pour permettre la communication de donnees entre le PEM et les professionnels de
sante. De tels moyens permettent denvoyer les ECG collectes par le patient `a un serveur
web sur lequel chaque patient disposerait dun dossier medical electronique ainsi que de
sa propre base de donnees ECG. Ces donnees peuvent etre dynamiquement mises `a jour
et revisees au moyen de technologies de grilles de calcul et de services web.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

115

Service web et grille de calcul : grille pervasive


La technologie service web en informatique m
edicale Par definition, un service
web est une entite logicielle concue pour permettre linteraction fluide et transparente
entre des applications heterog`enes `a travers un reseau. Un service web est dote dune
interface decrite dans un format interpretable par les machines : le format WSDL. Les applications interagissent avec le service web moyennant des messages en SOAP2 , transmis
via HTTP avec une serialisation XML en conjonction avec les standards Web. Larchitecture des services web comprend trois technologies emergentes : SOAP, WSDL3 , et UDDI4 .
Un processus service web typique inclut :
un fournisseur de services (provider) qui deploie les services web representant la
gamme de services, applications et specificites syst`emes fournies par ce fournisseur,
et qui seront publiees dans un registre UDDI,
un demandeur de service (requester) qui fouille le registre `a la recherche du service
requis et pourrait par la suite etre mis en lien avec le fournisseur.
Les services web fournissent une base de reference commune pour deployer, representer
et formater `a la fois les entrees et les sorties des donnees des applications dinformatique
medicale existantes.

Lapport de linfrastructure grille de calcul Linteret majeur dune plateforme


de synth`ese dECG est de permettre une application `a grande echelle de lapprentissage
neuronal afin de configurer un dispositif de transformation specifique `a chaque utilisateur du PEM. Cependant, un tel objectif nest pas realisable sans la mise en uvre
de ressources de calcul suffisantes. Do`
u linteret de faire appel `a une infrastructure `a
base de grille de calcul. Une grille de calcul est une infrastructure materielle et logicielle qui fournit un acc`es consistant, pervasif et non co
uteux `a des ressources de traitement consequentes. Au cours des 5 derni`eres annees, les outils de developpement et de
deploiement des applications de grille de calcul sont devenus de plus en plus nombreux :
Legion (http ://legion.virginia.edu), Condor (http ://www.cs.wisc.edu/condor), Unicore
(http ://www.unicore. org), Globus (http ://www.globus.org/toolkit) etc. Ces outils permettent la coordination des ressources qui ne sont pas sujet `a un controle centralise en
utilisant des protocoles et interfaces generiques et standards et de delivrer une qualite de
service constante.
La combinaison de ces technologies de service web et grille de calcul sous lintitule
2

SOAP (Simple Object Access Protocol) est un protocole de transmission de messages. SOAP nest
ni lie `a un syst`eme dexploitation ni `a un langage de programmation. En tant que tel, il sagit dun
important composant de base pour developper des applications distribuees
3
WSDL est le langage de description des services Web (Web Services Description Language). Un fichier
WSDL est un document XML decrivant un ensemble de messages SOAP et la mani`ere dont les messages
sont echanges
4
UDDI (Universal Discovery Description and Integration) est lequivalent des pages jaunes dans les
services Web. Une entree du repertoire UDDI est constituee dun fichier XML qui decrit une entreprise
et les services quelle offre.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

116

de grille pervasive suscite de plus en plus dinteret en telemedecine [144]. La figure 4.5
illustre bien lutilite dune strategie de deploiement faisant appel `a de telles technologies
dans le cadre de notre application.

Fig. 4.5 Grille pervasive au service de la telemedecine. Inspire de David De Roure,


Mobile Medical Monitoring, National e-Science Centre Talk.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

4.3.3

117

Sc
enario dutilisation du module de synth`
ese dECG

Moyennant la technologie des services web et linfrastructure de grille de calcul, la


tache dapprentissage des reseaux de neurones est deleguee `a un service web. Ce dernier
sapproprie des ressources de calcul necessaires pour effectuer un apprentissage dun comite de reseaux de neurones specifiques et pour renvoyer les resultats au PEM. Le mode
de fonctionnement envisage est le suivant (Figure 4.6) :
Lors de la premi`ere utilisation du syst`eme et jusqu`a lacquisition dun ECG standard
de reference, lutilisateur enregistre un ECG 3D et lECG artificiel 12D correspondant serait synthetise `a partir de lECG PEM en appliquant le comite de reseaux
de neurones generiques stocke initialement dans le PEM.
Le module de synth`ese dECG est mis `a jour par lajout dun dispositif de synth`ese
dECG specifique `a loccasion dune des visites du patient chez son cardiologue.
Cette mise `a jour est conditionnee par lacquisition dun ECG standard 12D par le
cardiologue. Ce dernier acc`ede via Internet `a lun des serveurs dapplication dEPIMEDICS, envoie lECG du patient au serveur dapplication qui, `a laide dun service
web, calcule et retourne un comite de reseaux de neurones specifique au patient. En
effet, `a chaque nouvelle acquisition dECG standard 12D, le cardiologue devrait
envoyer ces nouveaux ECG au serveur dapplication pour etre stockes dans une
base de donnees propre au patient. Cette base de donnees servira ulterieurement `a
mettre `a jour `a la fois les dispositifs de synth`ese dECG specifique et generique.
En outre, meme si la synth`ese specifique sest averee etre plus precise, la reconstruction par voie generique reste particuli`erement attrayante dans les situations o`
u
le bruit ou des artefacts sont releves sur les signaux. En effet, alors que la reconstruction specifique peut devenir davantage influencee par ce phenom`ene et produire
des ECG de mauvaise qualite avec un risque dalterer le contenu diagnostique, la
reconstruction generique est moins vulnerable `a cet effet puisquelle a ete obtenue
`a partir dun grand ensemble dECG anonymes et variables intra et inter sujets.
Pour ces raisons, chaque fois que lutilisateur du PEM acquiert un nouvel ECG,
les deux dispositifs de synth`ese specifique et generique sont employes pour produire
respectivement deux ECG de synth`ese, lun generique et lautre specifique. Un module danalyse de la qualite du signal devrait etre concu pour determiner le meilleur
ECG synthetise suivant une serie de test : par exemple, comparaison par rapport `a
lECG de reference acquis par le cardiologue, etc. Ceci aiderait `a eviter les erreurs
de diagnostic dues `a une mauvaise qualite dECG synthetises.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

118

Fig. 4.6 Scenario dutilisation du module de synth`ese dECG. Le cardiologue acquiert


un ECG standard 12D du patient, acc`ede via Internet au serveur dapplication qui, `a laide
dun service web, reserve les ressources necessaires, calcule et met `a jour les dispositifs de
synth`ese dECG par reseaux de neurones dans le PEM.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM

4.4

119

Conclusion

Dans ce chapitre, nous avons presente les aspects lies au deploiement et `a la maintenance de la plateforme decisionnelle du PEM, en particulier le module neuronal dinterpretation de lECG PEM, et le module de gestion et denvoi dalarmes. Nous avons
egalement presente les strategies de deploiement du module de reconstruction de lECG
par comites de reseaux de neurones integrant des serveurs web applicatifs et des grilles de
calcul. La mise en application de ce module dans le cadre dun scenario global `a grande
echelle de calcul dune matrice de synth`ese specifique `a chaque utilisateur du PEM serait
sans doute lune des principales perspectives de recherche future de nos travaux.

Quatri`
eme partie
Conclusion g
en
erale

120

Conclusion g
en
erale
Ce memoire constitue une presentation detaillee de mes travaux de recherche au cours
de 4 annees de th`ese. Ces travaux, qui sinscrivent dans la continuite du projet europeen
EPI-MEDICS qui a pour objectif la realisation dun moniteur personnel dECG (PEM),
ont contribue `a mettre en uvre les modules de diagnostic automatique de linfarctus et
la synth`ese de lECG standard. Ces modules seront les fondements de la future plateforme
daide `a la decision qui sera embarquee dans le PEM.
Trois domaines detude ont ete abordes dans cette th`ese : le classement automatique,
la fusion de donnees, et lapproximation de signaux. Pour chacune de ces parties, nous
presentons ci-apr`es un resume de notre contribution et quelques perspectives.

Interpr
etation automatique de lECG et fusion de
donn
ees
R
esum
e
Les travaux presentes dans la premi`ere partie du document (chapitre 2) interviennent
dans la realisation des divers modules de la plateforme intelligente daide `a la decision
qui sera ulterieurement integree dans le PEM. Cette plateforme, basee sur lutilisation
de techniques dintelligence artificielle, combinera `a la fois linterpretation de lECG du
patient et des donnees cliniques contenues dans son dossier medical personnel pour generer
un score de risque dinfarctus. Larchitecture fonctionnelle de la plateforme fut lobjet
dune presentation lors des Journees Sciences, Technologies et Imagerie pour la Medecine
`a Nancy en Mars 2005 [145].
Le module dinterpretation des ECG enregistres par lutilisateur lui-meme etablit un
diagnostic dinfarctus du myocarde par le biais des reseaux de neurones qui ont montre
une performance de diagnostic elevee, comparable `a celle des experts cardiologues. Cette
superiorite des reseaux de neurones, par rapport `a des approches traditionnelles telles que
lanalyse discriminante, provient principalement de la combinaison de leurs resultats.

122
Le module de stratification des facteurs de risque par reseaux bayesiens permet destimer le taux de risque de la survenue dun evenement cardiovasculaire en sappuyant sur
les facteurs de risque propres au patient. La performance enregistree par lapproche des
reseaux bayesiens sest averee tr`es prometteuse. Jai ete invite `a presenter une communication orale sur les resultats du module bayesien lors du 6`eme STAFF Studies Symposium
qui a ete organise par le Duke Medical Center de Durham `a St Jean dArdi`eres en septembre 2005. De meme, la presentation de la methode et des resultats viennent detre
acceptes pour publication `a la conference internationale IEEE Computers in Cardiology
2006 [115].

Perspectives
Les perspectives devolution et damelioration des methodes presentees dans cette
partie, les reseaux de neurones et les reseaux bayesiens, sont tr`es nombreuses pour diverses
raisons :
dune part liees au fait quil faudrait explorer de nouvelles approches doptimisation
des methodes actuelles. En effet, la marge de progression reste consequente :
au niveau du pretraitement des donnees (le choix de lACP pour les reseaux
de neurones. . . ),
et de loptimisation de lapprentissage neuronal via des techniques dapprentissage selective [96], evolutive [95], etc.
dautre part, lies au fait quil faudrait tester dautres techniques de prediction,
notamment pour le module de stratification des facteurs de risque. Les reseaux
bayesiens dynamiques devraient etre testes par rapport aux reseaux bayesiens statiques que nous avons utilises jusqu`a present. Mais cela est conditionne par le
fait davoir une base de donnees dynamique o`
u chaque patient dispose dun suivi
regulier avec enregistrement de tous les ECG, donnees cliniques, evolution diagnostique dans la base de donnees. En dautres termes, il faudrait avoir, pour le meme
patient, un historique medical complet et seriel afin de pouvoir etablir une stratification evolutive du risque cardiovasculaire. De meme, la construction (en cours)
dune base de donnees PEM (ECG PEM, ECG standards, donnees cliniques, etc.)
devrait permettre de tester differents scenarios dinteraction entre les classifieurs
grace `a la mise en uvre dalgorithmes de logique floue pour maximiser la sensibilite dinterpretation du syst`eme tout en conservant une specificite elevee.
Enfin, la validation des diverses methodes et techniques developpees au cours de cette
th`ese necessitent deffectuer des evaluations cliniques consequentes pour sassurer de la
qualite des algorithmes mis en place, evaluations qui sont de fait freinees par labsence
de bases de donnees dans ce domaine. Une premi`ere etape devaluation va etre effectuee
sur une serie de bases de donnees `a laquelle nous avons recemment eu acc`es (BUSSELTON [146], MRACS [147]). Ulterieurement, les methodes et algorithmes developpes et
implementes dans le syst`eme vont faire lobjet dune experimentation pilote et dune
evaluation clinique en region Rhone-Alpes dans le cadre du projet SIPIRA (Syst`eme
Integre Pervasif Intelligent de suivi de patients cardiaques en region Rhones-Alpes), etc.

123

Synth`
ese de lECG par comit
es de r
eseaux de neurones
R
esum
e
Lautre apport de cette th`ese est le developpement dune methode originale et performante permettant la synth`ese de lECG standard 12 derivations `a partir dun ECG
simplifie enregistre par le patient. Les evaluations effectuees sur une population detude
de 300 patients de la base de donnees de Lund ont montre une amelioration de plus de 15%
en qualite de signal par rapport aux methodes lineaires preconisees par la litterature. Les
resultats de cette experimentation ont ete presentes `a la conference internationale IEEE
Computers in Cardiology en septembre 2004 [140]. La deuxi`eme etape devaluation, diagnostique, sur la base de donnees de Lund est prevue pour publication. La troisi`eme etape
devaluation sur la base de donnees CHDB (ECG PEM 3D et ECG standard 12D) a ete
soumise pour publication dans la revue internationale Methods of Information in Medicine [141]. Cette derni`ere phase devaluation de la methode de synth`ese par reseaux de
neurones sur des ECG 12D seriels ou des ECG PEM enregistres dans des conditions simulant celles dutilisation du PEM (cest `a dire en ambulatoire ou `a domicile, acquisition
par le patient, son entourage ou une aide soignante, avec un positionnement delectrodes
different de celui de lECG standard 12D), a montre une performance largement superieure
`a celle de la litterature.

Perspectives
Lapproche de reconstruction que jai developpee a prouve son efficacite. La prochaine
etape consistera `a proceder au deploiement de la methode dans le PEM et `a prevoir
linfrastructure necessaire pour realiser lapprentissage neuronal `a grande echelle, `a savoir
le recours aux technologies des services web et grilles de calcul.

Le mot de la fin
Lobjectif de cette th`ese a ete de contribuer `a la conception et la realisation dun moniteur personnel dECG (PEM) capable de detecter les dysfonctionnements cardiaques, de
gerer des alarmes et de transmettre les informations relatives `a lutilisateur du syst`eme (citoyen/patient) aux services de sante concernes. Lensemble des travaux qui a ete presente
dans cette th`ese est motive par la volonte de developper un outil efficace de prevention
qui pourrait reduire la mortalite et la morbidite liees `a la survenue devenements cardiovasculaires en reduisant le temps separant lapparition des symptomes et le debut
des traitements. Nous esperons que cette etude servira `a stimuler la recherche dans ce
domaine.

Bibliographie
[1] World health statistics 2006, World Health Organization, Tech. Rep., 2006.
[2] Recommendations of a Task Force of the European Society of Cardiology and the
European Resuscitation Council on The Pre-Hospital Management of Acute Heart
Attacks, Eur Heart J, vol. 19, pp. 114064, 1998.
[3] J. McMurray et al., CardiologyI : Treatment of myocardial infarction, unstable
angina, and angina pectoris, BMJ, vol. 309, no. 6965, pp. 134350, 1994.
[4] R. Luepker, Delay in acute myocardial infarction : why dont they come to the
hospital more quickly and what can we do to reduce delay ? Am Heart J, vol. 150,
no. 3, pp. 36870, 2005.
[5] A. McGinn, D. Goff, H. Taylor, et al., Trends in prehospital delay time and use
of emergency medical services for acute myocardial infarction : experience in 4 US
communities from 1987-2000, Am Heart J, vol. 150, no. 3, pp. 392400, 2005.
[6] P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al., New paradigms in telemedicine : ambient intelligence, wearable, pervasive and personalized, Stud Health
Technol Inform, vol. 108, pp. 12332, 2004.
[7] P. Rubel, J. Fayn, S. Arod, H. Atoui, D. Telisson, et al., Intelligence Ambiante et
Syst`emes Pervasifs en Telemedecine. Exemples dApplications en Telecardiologie,
La Revue des SAMU, vol. 26, pp. 521526, 2004.
[8] Myocardial Infarction redefined - A concensus document of the joint European Society of Cardiology / American College of Cardiology Committee for the redefinition
of myocardial Infarction, Eur Heart J, vol. 21, pp. 15021513, 2000.
[9] S. Smith, S. Blair, R. Bonow, L. Brass, et al., AHA/ACC Guidelines for Preventing
Heart Attack and Death in Patients With Atherosclerotic Cardiovascular Disease :
2001 update. A statement for healthcare professionals from the American Heart
Association and the American College of Cardiology, J Am Coll Cardiol, vol. 38,
no. 5, pp. 15813, 2001.
[10] H. McGill, C. McMahan, E. Herderick, et al., Obesity accelerates the progression
of coronary atherosclerosis in young men, Circulation, vol. 105, no. 23, pp. 27128,
2002.

BIBLIOGRAPHIE

125

[11] L. Goldstein, R. Adams, M. Alberts, L. Appel, et al., Primary prevention of ischemic stroke : a guideline from the American Heart Association/American Stroke
Association Stroke Council, Circulation, vol. 113, no. 4, pp. 873923, 2006.
[12] J. Salonen, G. Alfthan, J. Huttunen, J. Pikkarainen, et al., Association between
Cardiovascular Death and Myocardial Infarction and Serum Selenium in a Matchedpair Longitudinal Study, Lancet, vol. 24, pp. 175179, July 1982.
[13] A. Kadish, A. Buxton, H. Kennedy, B. Knight, et al., ACC/AHA clinical competence statement on electrocardiography and ambulatory electrocardiography : A
report of the ACC/AHA/ACP-ASIM task force on clinical competence (ACC/AHA
committee to develop a clinical competence statement on electrocardiography and
ambulatory electrocardiography) endorsed by the International Society for Holter
and noninvasive electrocardiology, Circulation, vol. 104, no. 25, pp. 316978, 2001.
[14] J. Alpert, K. Thygesen, E. Antman, et al., Myocardial infarction redefineda
consensus document of The Joint European Society of Cardiology/American College of Cardiology Committee for the redefinition of myocardial infarction, J Am
Coll Cardiol, vol. 36, no. 3, pp. 959969, 2000.
[15] B. McCarthy, J. Beshansky, et al., Missed diagnoses of acute myocardial infarction
in the emergency department : Results from a multicenter study, Ann Emerg Med,
vol. 22, pp. 579582, 1993.
[16] R. Puleo, D. Meyer, C. Wathen, C. Tawa, et al., Use of a rapid assay of subforms
of creatine kinase MB to diagnose or rule out acute myocardial infarction, N Engl
J Med, vol. 331, pp. 561566, 1994.
[17] R. Roberts et al., Earlier diagnosis and treatment of acute myocardial infarction
necessitates the need for a new diagnostic mind set, Circulation, vol. 89, pp.
872881, 1994.
[18] J. Pope, T. Aufderheide, R. Ruthazer, R. Woolard, et al., Missed diagnoses of acute
cardiac ischemia in the emergency department, N Engl J Med, vol. 342, no. 16, pp.
11631170, 2000.
[19] H. Koukkunen, K. Pyorala, et al., Low-risk patients with chest pain and without
evidence of myocardial infarction may be safely discharged from emergency department, Eur Heart Journal, vol. 25, pp. 329334, 2004.
[20] C. Swap et al., Value and Limitations of Chest Pain History in the Evaluation of
Patients With Suspected Acute Coronary Syndromes, JAMA, vol. 294, pp. 2623
2629, 2005.
[21] J. Willems, P. Arnaud, J. van Bemmel, R. Degani, et al., Common standards
for quantitative electrocardiography : goals and main results. CSE working party,
Methods Inf Med, vol. 29, no. 4, pp. 28997, 1990.

BIBLIOGRAPHIE

126

[22] M. Ohlson, H. Ohlin,


S. Wallerstedt, et al., Usefulness of Serial Electrocardiograms
for Diagnosis of Acute Myocardial Infarction, Am J Cardiol, vol. 88, no. 5, pp. 478
481, 2001.
[23] P. Rubel, J. Fayn, et al., State of the art of automated and serial ECG analysis,
Information Society Technologies Programme, Tech. Rep. D2.1, 2001.
[24] P. Arnaud, P. Rubel, D. Morlet, J. Fayn, et al., Methodology of ECG Interpretation
in the Lyon Program, Methods Inf Med, vol. 24, no. 4, pp. 393402, 1990.
[25] J. Willems, C. Abreu-Lima, P. Arnaud, et al., The diagnostic performance of computer programs for the interpretation of electrocardiograms, N Engl J Med, vol.
325, no. 25, pp. 176773, 1991.
[26] J. Fayn et al., Caviar, a Serial ECG Processing System for the Comparative Analysis of VCGs and their Interpretation with Auto-reference to the Patient, J Electrocardiol, no. 21, pp. 173176, 1988.
[27] J. Fayn, Lanalyse sequentielle des electrocardiogrammes. une approche par comparaison optimale dimages filaires spatio-temporelles, Ph.D. dissertation, INSA de
Lyon, 1990.
[28] P. Macfarlane, Computer Processing of the 12-Lead ECG, Cardiac Electrophysiology Review, vol. 1, no. 3, pp. 296301, 1997.
[29] L. Dowdy, G. Wagner, Y. Birnbaum, P. Clemmensen, et al., Early repolarization :
friend or foe ? Am J Med, vol. 115, no. 3, pp. 23740, 2003.
[30] J. Healy, Editorial of the special health and the Internet for all, Int J Med Inform,
vol. 75, no. 1, 2006.
[31] A. Bynum, C. Cranford, C. Irwin, et al., Effect of telemedicine on patients diagnosis and treatment, J Telemed Telecare, vol. 12, no. 1, pp. 3943, 2006.
[32] J. Fayn, C. Ghedira, D. Telisson, et al., Towards New Integrated Information and
Communication Infrastructures in eHealth. Examples from Cardiology, in IEEE
Computers in Cardiology, A. Murray, Ed., vol. 30, 2003, pp. 11316.
[33] C. Massone, H. Soyer, R. Hofmann-Wellenhof, et al., Two years experience with
Web-based teleconsulting in dermatology, J Telemed Telecare, vol. 12, no. 2, pp.
837, 2006.
[34] J. Ameen, A. Coll, et al., Impact of tele-advice on community nurses knowledge
of venous leg ulcer care, J Adv Nurs, vol. 50, no. 6, pp. 58394, 2005.
[35] J. Fayn, F. Petitjean, et al., Macro-data : a new approach for the development of
tele-expertise applications, in IEEE Computers in Cardiology, vol. 26, 1999, pp.
414.

BIBLIOGRAPHIE

127

[36] V. Rialle, N. Noury, et al., An experimental health smart home and its distributed
internet-based information and communication system : first steps of a research
project, in Medinfo, vol. 10, no. 2, 2001, pp. 147983.
[37] J. Thomesse, D. Belot, A. Boyer, et al., Integrated information technologies for
patients remote follow up and homecare, in HealthCom, 2001, pp. 315.
[38] P. Rubel, J. Willems, C. Zywietz, J. Fayn, et al., Health in the New Communications
Age. IOS Press, 1995, vol. 24, ch. OEDIPE. Open European Data Interchange and
Processing for Electrocardiography, pp. 313321.
[39] Health in the New Communications Age. IOS Press, Amsterdam, 1995, vol. 24.
[40] J. van Bemmel, A. van Ginneken, H. Stam, et al., Integration and communication
for the continuity of cardiac care (i4c), J Electrocardiol, vol. 31, pp. 608, 1998.
[41] J. van Bemmel, Handbook of Medical Informatics. Springer, New York, 2002.
[42] P. Rubel et al., Protocole de communications standard pour lelectrocardiographie
quantitative, Informatique et Sante, vol. 4, pp. 4555, 1991.
[43] Medical informatics standard communication protocol-computer-assisted electrocardiography (SCP-ECG), ENV, Tech. Rep. 1064, 1993.
[44] J. Willems, P. Rubel, et al., Standard interchange for computerized electrocardiography, Stud Health Technol Inform, vol. 6, pp. 18594, 1993.
[45] P. Rubel, J. Willems, et al., Development of a conceptual reference model for digital
ECG data storage, in IEEE Computers in Cardiology, vol. 18, 1991, pp. 10912.
[46] P. Rubel, J. Willems, C. Zywietz, et al., Towards open data interchange and processing of serial ECGs, in IEEE Computers in Cardiology, vol. 19, 1992, pp. 7982.
[47] P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, et al., Toward personal eHealth in
cardiology. Results from the EPI-MEDICS telemedicine project, J Electrocardiol,
vol. 38, pp. 100106, 2005.
[48] E. Harold et al., XML in a Nutshell, Third Edition. OReilly Media, Paris, 2004.
[49] E. Berner, Clinical Decision Support Systems : Theory and Practice. Springer, NY,
1998.
[50] J. Haton, N. Bouzid, F. Charpillet, et al., Le raisonnement en intelligence artificielle.
InterEditions, Paris, 1991.
[51] A. Jain, R. Duin, et al., Statistical Pattern Recognition : a review, IEEE Trans
Pattern Anal Mach Intell, vol. 22, pp. 437, 2000.
[52] C. Bishop, Neural Networks for Pattern Recognition.
Oxford, 1996.

Oxford University Press,

BIBLIOGRAPHIE

128

[53] B. Kirkwood et al., Essential Medical Statistics. Blackwell Science, UK, 2003.
[54] G. McLachlan, Discriminant Analysis and Statistical Pattern Recognition.
Interscience, Canada, 2004.

Wiley

[55] H. Bengtsson, Bayesian Networks : a Self-contained Introduction with Implementation Remarks, Mathematical Statistics, Lund Institute of Technology, Tech. Rep.,
1999.
[56] G. Luger, Artificial Intelligence : Structures and Strategies for Complex Problem
Solving. Addison Wesley, 2004.
[57] A. Sharkey et al., Diversity, Selection and Ensembles of Artificial Neural Nets,
in Proceedings of Third International Conference on Neural Networks and their
Applications, Marseille, France, March 1997, pp. 205212.
[58] J. Bailey, A. Berson, H. Handelsman, et al., Utility of Current Risk Stratification
Tests for Predicting Major Arrhythmic Events After Myocardial Infarction, JACC,
vol. 38, no. 7, pp. 190211, 2001.
[59] A. D. Timmis, Early diagnosis of acute myocardial infarction, BMJ, vol. 301, pp.
941942, 1990.
[60] A. Timmis, Will serum enzymes and other proteins find a clinical application in
the early diagnosis of myocardial infarction ? Br Heart J, vol. 71, pp. 309310,
1994.
[61] H. Lee, S. Cross, P. Garthwaite, A. Dickie, I. Ross, et al., Comparison of the value
of novel rapid measurement of myoglobin, creatine kinase, and creatine kinase-MB
with the electrocardiogram for the diagnosis of acute myocardial infarction, Br
Heart J, vol. 71, pp. 311315, 1994.
[62] J. Mair, J. Smidt, P. Lechleitner, F. Dienstl, et al., A decision tree for the early
diagnosis of acute myocardial infarction in nontraumatic chest pain patients at
hospital admission, Chest, vol. 108, pp. 15021509, 1995.
[63] L. Jeanpierre et al., Automated medical diagnosis with fuzzy stochastic models :
monitoring chronic diseases, Acta Biotheor, vol. 52, no. 4, pp. 291311, 2004.
[64] D. Bellot, Fusion de donnees avec des reseaux bayesiens pour la modelisation des
syst`emes dynamiques et son application en telemedecine, Ph.D. dissertation, Universite Nancy1, 2002.
[65] P. Lisboa, Artificial neural networks in biomedicine. Springer-Verlag, London, 2000.
[66] W. Baxt, Use of an artificial neural network for the diagnosis of myocardial infarction, Ann Intern Med, vol. 115, no. 11, pp. 843848, 1991.

BIBLIOGRAPHIE

129

[67] R. Harrison, S. Marshall, et al., The early diagnosis of heart attacks : a neurocomputational approach, in International Joint Conference on Neural Networks,
vol. 1, 1991, pp. 15.
[68] R. Kennedy, R. Harrison, A. Burtonc, et al., An artificial neural network system
for diagnosis of acute myocardial infarction (AMI) in the accident and emergency
department : evaluation and comparison with serum myoglobin measurements,
Comput Methods Programs Biomed, vol. 52, pp. 93103, 1997.
[69] W. Baxt, F. Shofer, F. Sites, et al., A neural computational aid to the automated
diagnosis of acute myocardial infarction, Ann Emerg Med, vol. 34, pp. 366373,
2002.

[70] B. Heden, H. Ohlin,


R. Rittner, et al., Acute myocardial infarction detected in the
12-lead ECG by artificial neural networks, Circulation, vol. 96, no. 6, pp. 1798
1802, 1997.
[71] K. Gurney, An Introduction to Neural Networks. 1st ed. UCL Press, London, 1997.
[72] F. Rosenblatt, Principles of Neurodynamics.
1961.
[73] L. Fausett, Fundamentals of Neural Networks.
NJ, 1994.

Spartan Press, Washington D.C.,


Prentice Hall, Englewood Cliffs,

[74] T. Kohonen, Self-Organizing Maps. Springer, Berlin, 1995.


[75] J. Hopfield, Neural networks and physical systems with emergent collective computational abilities, in National Academy of Sciences, vol. 79, 1982, pp. 25542558.
[76] D. Rumelhart, G. Hinton, et al., Learning internal representations by error propagation, in Parallel Data Processing, vol. 1. The M.I.T. Press, Cambridge, MA,
1986, pp. 318362.
[77] L. Hansen et al., Neural network ensembles, IEEE Trans Pattern Anal Mach
Intell, vol. 12, pp. 9931001, 1990.
[78] A. Krogh et al., Neural network ensembles, cross validation, and active learning,
in Adv Neural Inf Process Syst, G. Tesauro, D. Touretzky, et al., Eds., vol. 2, 1995,
pp. 650659.
[79] D. Opitz et al., Popular ensemble methods : An empirical study, Journal of Artificial Intelligence Research, vol. 11, pp. 169198, 1999.
[80] A. Sharkey, On combining artificial neural nets, Connection Science, vol. 8, pp.
299314, 1996.
[81] L. Breiman, Bagging predictors, Machine Learning, vol. 24, no. 2, pp. 123140,
1996.

BIBLIOGRAPHIE

130

[82] Y. Freund et al., Experiments with a new boosting algorithm, in International


Conference on Machine Learning, 1996, pp. 148156.
[83] Y. Liu, X. Yao, et al., Evolutionary ensembles with negative correlation learning,
IEEE Transactions on Evolutionary Computation, vol. 4, no. 3, pp. 295304, 2000.
[84] B. Rosen, Ensemble learning using decorrelated neural networks, Connection
Science, vol. 8, pp. 373384, 1996.
[85] A. Sharkey, Combining Artificial Neural Nets : Ensemble and Modular Multi-Net
Systems, in Multi-Net Systems. Springer-Verlag, 1999, pp. 130.
[86] C. Papaloukas, D. Fotiadis, A. Likas, et al., An ischemia detection method based
on artificial neural networks, Artif Intell Med, vol. 24, pp. 167178, 2002.
[87] D. Marquardt, An algorithm for least-squares estimation of nonlinear parameters,
Journal of the Society for Industrial and Applied Mathematics, vol. 11, no. 2, pp.
431441, 1963.
[88] P. Gill, W. Murray, et al., The Levenberg-Marquardt Method, in Practical Optimization. Academic Press, 1981, pp. 136137.
[89] A. Jerebko, R. Summers, J. Malley, M. Franaszek, et al., Computer-assisted detection of colonic polyps with CT colonography using neural networks and binary
classification trees, Med Phys, vol. 30, no. 1, pp. 5260, 2003.
[90] A. Jerebko, J. Malley, M. Franaszek, et al., Multiple Neural Network Classification
Scheme for Detection of Colonic Polyps in CT Colonography Data Sets, Acad
Radiol, vol. 10, pp. 154160, 2003.
[91] J. Ellenius, T. Groth, B. Lindahl, et al., Early assessment of patients with suspected acute myocardial infarction by biochemical monitoring and neural network
analysis, Clin Chem, vol. 43, no. 10, pp. 191925, 1997.
[92] P. Warrick, E. Hamilton, et al., Neural Network Based Detection of Fetal Heart
Rate Patterns, in IEEE International Joint Conference on Neural Networks
(IJCNN), vol. 4, 2005, pp. 24002405.
[93] D. Bates et al., Improving safety with information technology, N Engl J Med, vol.
348, no. 25, pp. 252634, 2003.
[94] E. Vonk, L. Jain, et al., Automatic Generation of Neural Network Architecture Using
Evolutionary Computation. World Scientific Publishing Co., Singapore, 1997.
[95] H. Haraldsson et al., A New Learning Scheme for Neural Network Ensembles,
2004, submitted to IEEE Trans Neural Netw.
[96] Z. Zhou, J. Wu, W. Tang, et al., Selectively Ensembling Neural Classifiers, in
International Joint Conference on Neural Networks, vol. 2, 2002, pp. 14111415.

BIBLIOGRAPHIE

131

[97] G. Diamond et al., Analysis of probability as an aid in the clinical diagnosis of


coronary-artery disease, N Engl J Med, vol. 300, pp. 13501358, 1979.
[98] P. Szolovits, Uncertainty and decisions in medical informatics, Methods Inf Med,
vol. 34, pp. 11121, 1995.
[99] C. Kahn, Artificial intelligence in radiology : decision support systems, Radiographics, vol. 14, pp. 849861, 1994.
[100] C. Lagor, D. Aronsky, M. Fiszman, et al., Automatic identification of patients eligible for a pneumonia guideline : comparing the diagnostic accuracy of two decision
support models. in Medinfo, vol. 10, no. 1, 2001, pp. 4937.
[101] D. Luciani, M. Marchesi, et al., The role of Bayesian Networks in the diagnosis of
pulmonary embolism, J Thromb Haemost, vol. 1, no. 4, pp. 698707, 2003.
[102] C. Twardy, A. Nicholson, K. Korb, et al., Data mining cardiovascular Bayesian
networks, Health Data Mining Workshop, Univ. of South Australia, 2005.
[103] F. Gueyffier, F. Boutitie, J. Boissel, et al., INDANA : a meta-analysis on individual
patient data in hypertension. Protocol and preliminary results, Therapie, vol. 50,
no. 4, pp. 353362, 1995.
[104] T. Stephenson, An Introduction to Bayesian Network Theory and Usage, IDIAP,
Research Report 00-03, 2000.
[105] F. Jensen et al., Optimal Junction Trees, in Proceedings of the 10th Conference
on Uncertainty in Artificial Intelligence, July 1994.
[106] F. Jensen, An Introduction to Bayesian Networks. UCL Press Ltd, London, 1996.
[107] C. Huang et al., Inference in Belief Networks : A Procedural Guide, International
Journal of Approximate Reasoning, vol. 15, pp. 225263, 1996.
[108] J. Bilmes, A Gentle Tutorial of the E.M. Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models, International
Computer Science Institute, Berkeley California, Tech. Rep., 1998.
[109] A. Dempster, N. Laird, et al., Maximum Likelihood from Incomplete Data via the
E.M. Algorithm, J R Stat Soc, vol. Ser.B 39, no. 1, pp. 138, 1977.
[110] I. Colombet, A. Ruelland, G. Chatellier, et al., Models to Predict Cardiovascular
Risk : Comparison of CART, Multilayer Perceptron and Logistic Regression, in
AMIA Symposium, 2000, pp. 156160.
[111] B. Wielinga, G. Schreiber, et al., KADS : a modelling approach to knowledge
engineering. In Knowledge Acquisition, Knowledge Acquisition, vol. 4, pp. 136
145, 1992.
[112] C. Vogel, Genie Cognitif. Masson, Paris, 1988.

BIBLIOGRAPHIE

132

[113] J. Quinlan, P. Compton, et al., Inductive knowledge acquisition : A case study.


Turing Institute Press, Glascow, 1987.
[114] J. Ganascia, EKAW 90 Tutorial Notes : Machine Learning, in Proceedings of the
3rd European Workshop on Knowledge Acquisition for Knowledge-Based Systems
(EKAW 89), 1989, pp. 287296.
[115] H. Atoui, J. Fayn, F. Gueyffier, et al., Cardiovascular Risk Stratification in Decision Support Systems, A Probabilistic Approach. Application to pHealth, 2006,
accepted for publication in IEEE Computers in Cardiology.
[116] L. Zadeh, Fuzzy logic, neural networks, and soft computing, Communications of
the ACM, vol. 37, pp. 7783, 1994.
[117] B. Bouchon-Meunier, La logique floue. Presses Universitaires France, 1994.
[118] F. Chevrie et al., La logique floue, Institut Schneider Formation, Cahier Technique Schneider n 191, 1998.
[119] S. Nelwan, Evaluation of 12-Lead ECG Reconstruction Methods for Patient Monitoring, Ph.D. dissertation, Erasmus Universiteit Rotterdam, 2005.
[120] J. Scherer, J. Jenkins, et al., Synthesis of the 12-lead electrocardiogram from a 3lead subset using patient-specific transformation vectors. An algorithmic approach
to computerized signal synthesis, J Electrocardiol, vol. 22, pp. 128136, 1989.
[121] S. Nelwan, J. Kors, S. Meij, et al., Reconstruction of the 12-Lead ECG using Reduced
Lead Sets for Patient Monitoring. Leiden : Einthoven Foundation, 2002, pp. 545
551.
[122] R. Modre, M. Seger, G. Fischer, et al., Cardiac anisotropy : is it negligible regarding
noninvasive activation time imaging ? IEEE Trans Biomed Eng, vol. 53, no. 4, pp.
569580, 2006.
[123] R. Gulrajani, The forward and inverse problems of electrocardiography, IEEE
Eng Med Biol Mag, vol. 17, no. 5, pp. 84101, 1998.
[124] J. Scherer et al., Evaluation of 12-Lead ECG Synthesis using Analysis Measurments
in 240 Patients, in IEEE Computers in Cardiology, 1992, pp. 914.
[125] S. Adami, D. Assanelli, F. Comba, J. Fayn, R. Gatta, et al., EPI-MEDICS System
Specification and Design, Information Society Technologies Programme, Tech. Rep.
D3.1, 2001.
[126] S. Adami, J. Fayn, F. Gouaux, M. Ohlson, L. Simon-Chautemps, et al., EPIMEDICS System Revisions, Information Society Technologies Programme, Tech.
Rep. D7.1, 2003.

BIBLIOGRAPHIE

133

[127] J. Scherer et al., Synthesis of the 12-Lead Electrocardiogram from a 3-Lead Semiorthogonal Subset using Patient-specific Transformation Arrays, in IEEE Computers in Cardiology, 1988, pp. 149151.
[128] S. Nelwan, J. Kors, S. Meij, J. van Bemmel, et al., Reconstruction of the 12-lead
electrocardiogram from reduced lead sets, J Electrocardiol, vol. 37, no. 1, pp. 1118,
2004.
[129] R. Duin, Learned from Neural Networks, in ASCI 2000, Sixth Annual Conference
of the Advanced School for Computing and Imaging, 2000, pp. 913.
[130] S. Mitra, S. Pal, et al., Data Mining in Soft Computing Framework : A Survey,
IEEE Trans Neural Netw, vol. 13, no. 1, pp. 314, 2001.
[131] K. Hornik, M. Stinchcombe, et al., Multilayer feedforward networks are universal
approximators, Neural Netw, vol. 2, no. 359-366, 1989.
[132] K. Funahashi, On the Approximate Realization of Continuous Mappings by Neural
Networks, Neural Netw, vol. 2, pp. 183192, 1989.
[133] J. Castro, C. Mantas, et al., Neural networks with a continuous squashing function
in the output are universal approximators, Neural Netw, vol. 13, no. 6, pp. 5613,
2000.
[134] P. Macfarlane, Age, sex, and the ST amplitude in health and disease, J Electrocardiol, vol. 34, pp. 23541, 2001.
[135] M. Krucoff, Electrocardiographic monitoring and coronary occlusion. Fingerprint
pattern analysis in dimensions of space, time, and mind, J Electrocardiol, vol. 22,
pp. 2327, 1989.
[136] G. Nollo, P. Rubel, J. Fayn, D. Assanelli, M. Crotti, et al., PEM device and
EPI-MEDICS telemedical architecture final assessment report, Information Society
Technologies Programme, Tech. Rep. D6.1, 2004.
[137] The CSE Party : Recommendations for measurement standards in quantitative
electrocardiography, Eur Heart J, vol. 6, pp. 815825, 1985.
[138] M. Moller, A scaled conjugate gradient algorithm for fast supervised learning,
Neural Netw, vol. 6, pp. 525533, 1993.
[139] S. Orfanidis, Optimum Signal Processing. An Introduction. 2nd Edition. PrenticeHall, Englewood Cliffs, NJ, 1996.
[140] H. Atoui, J. Fayn, et al., A Neural Network Approach for Patient-Specific 12Lead ECG Synthesis in Patient Monitoring Environments, in IEEE Computers in
Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 161164.

BIBLIOGRAPHIE

134

[141] H. Atoui et al., A Novel Neural Network Model for Deriving Standard 12-lead ECGs
from serial 3-lead ECGs. Application to Self Care, 2006, submitted to Methods Inf
Med.
[142] D. Telisson, J. Fayn, et al., Design of a Tele-Expertise Architecture Adapted to
Pervasive Multi-Actor Environments. Application to eCardiology, in IEEE Computers in Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 749752.
[143] L. Simon-Chautemps, S. Arod, S. Adami, J. Fayn, C. Malossi, et al., Final Prototype, Information Society Technologies Programme, Tech. Rep. D7.2, 2004.
[144] P. Gouvas, G. Magiorkinis, A. Bouras, D. Paraskevis, et al., Web Service-Enabled
Grid-Based Platform for Drug Resistance Management, in Panhellenic Conference
on Informatics, vol. 3746, 2005, pp. 469479.
[145] H. Atoui, D. Telisson, et al., Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide `a la decision par reseaux de
neurones du projet europeen EPI-MEDICS. in Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005, pp. 1314.
[146] M. Knuiman, H. Vu, et al., Multivariate risk estimation for coronary heart disease :
the Busselton health study, New Zealand Journal of Public Health, vol. 22, pp. 747
753, 1998.
[147] The MRACS study. URL http ://www.rcbweb.co.uk.

Cinqui`
eme partie
Annexes

135

Annexe A
Dossier M
edical Personnel embarqu
e
dans le PEM
A.1

Contenu du dossier de sant


e du patient

Ce dossier sera enregistre dans la Data Card du PEM (PEM Card) et sera consultable/modifiable au moyen dun navigateur Internet standard (connexion par RS232C ou
Bluetooth `a un PC, un MAC ou un Palmtop). Par defaut, une donnee non renseignee sera
marquee Non Renseignee (NR). Lorsque lon remplit le dossier, et que lon ne sait pas
renseigner la donnee, on pourra utiliser le terme : inconnu (I). Des exemples ditems
pour lequel on pourra utiliser le terme inconnu sont : le sexe, le diab`ete, la localisation
des stenoses, etc.

A.2

Donn
ees d
emographiques

Cette section ne contient que les donnees utiles au professionnel de sante lorsquil
entreprend de visualiser et/ou de mettre `a jour le dossier de sante du patient. Les donnees
demographiques compl`etes (avec adresse, numeros de telephone, description des contacts
etc.) sont indiquees dans la section contacts.
Nom
Prenom
Date de naissance : JJ/MM/AAA ou Age (ans)
Poids (Kg)
Taille (cm)
Sexe : (M, F, I)

Annexe A. Dossier Medical Personnel embarque dans le PEM

A.3

137

R
esultats danalyses biologiques

Cholesterol total (mg/dl)


Cholesterol HDL (mg/dl)
Cholesterol LDL (mg/dl)
Fibrinog`enes (mg/dl)
Triglycerides (mg/dl)
Glycemie (mg /dl)
Nbre de leucocytes (109 /l)
Creatinemie (mol/l)
Enzymes hepatiques ALAT (SGPT) (U/l)
Enzymes hepatiques ASAT (SGOT) (U/l)
Hormone thyrodienne T3 (g/dl)
Hormone thyrodienne T4 (Thyroxine) (g/dl)
Hormone thyrodienne TSH (Thyroid-Stimulating Hormone) (mili U/l)
Proteines C-reactives (mg/dl)

A.4
A.4.1

El
ements du dossier cardiologique
Donn
ees cliniques

Tension arterielle systolique (mm Hg)


Tension arterielle diastolique (mm Hg)
Frequence cardiaque au repos (battements/mn)
Anemie : (O/N)
Diab`ete : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))
Douleurs thoraciques : (Non, Angine de poitrine typique, Angine de poitrine atypique, autre)
Dyspnee(s) : (Non, au repos, `a leffort, au repos et `a leffort)
Sujet `a des Syncope(s) : (O/N)
Sujet `a des Vertiges : (Non, au repos, `a leffort, au repos et `a leffort)

A.4.2

Interpr
etation de lECG au repos

Cette interpretation concerne exclusivement linterpretation de synth`ese qui figurera


dans le dossier clinique du patient. Les interpretations des ECG enregistres par le patient
seront archivees dans la rubrique Rapport dinterpretation des PEM ECG

Annexe A. Dossier Medical Personnel embarque dans le PEM

138

Interpretation de lECG standard `a 12D : (Normal, probablement normal/non strictement normal, Anormal)
Troubles de la conduction : (O/N)
Instabilite electrique : (O/N)
Alteration(s) mineure(s) de lECG : (O/N)

A.4.3

R
esultats des tests de lECG deffort

Ischemie `a leffort : (O/N)


Hypotension durant leffort : (O/N)

A.4.4

Diagnostic cardiologique

Hypertension arterielle : (O/N)


Hypertrophie ventriculaire : (Non, gauche, droite, bi-ventriculaire)
Tachycardie ventriculaire : (Non, Intermittente/Non-soutenue, Soutenue)
Bloc auriculo-ventriculaire : (Non, 2`eme degre (Mobitz type II), 3`eme degre, autre)
Autre(s) type(s) darythmie(s) : (O/N)
Si oui, et si vous estimez que cest important pour le suivi du patient, precisez le
type darythmie dans lhistorique clinique du patient.
Stenose aortique : ( Non, I, LAD, LCX, RCA, autre)
Infarctus ancien : (Non, I, Anterieur ou Antero-Lateral, Inferieur ou PosteroInferieur, Mixte)
Ischemie residuelle : (O/N)
Dysfonctionnement du ventricule gauche : (O/N)
Insuffisance cardiaque : (Non, moderee, sev`ere)
Fraction dejection (%) :
Cardiopathies arythmog`enes congenitales ou acquises : (Non, QT long, Brugada,
WPW, ARVD, autre)
Cardiopathie valvulaire : (Non, prolapsus de valve mitrale, autre)
Cardiomyopathie du ventricule gauche : (Non, I, dilatee, hypertrophique, infiltrative,
autre)
Cardiomyopathie du ventricule droit : (O/N)
Autre type de cardiopathie congenitale : (O/N)
Maladie des coronaires dorigine anormale : (O/N)
Autre cardiopathie : (0/N)
Si oui, et si vous estimez que cest important pour le suivi du patient, precisez le
type de cardiopathie dans lhistorique clinique du patient.

Annexe A. Dossier Medical Personnel embarque dans le PEM

A.4.5

139

Proc
edures et traitements

Therapie interventionnelle : (Non, angioplastie, pontage coronarien, autre)


Traitement anti-cholesterol : (Non, statines, autres)
Traitement anti-hypertenseur : (O/N)
Autre(s) traitement(s) en cours : (O/N)
Si oui, et si vous estimez que cest important pour le suivi du patient, precisez le
type de traitement dans lhistorique clinique du patient.

A.5

Facteurs de risque cardiovasculaire

A.5.1

Classe de Sant
e

Indiquez ci-apr`es la categorie qui decrit le mieux possible letat general de sante du
patient. Ce classement sera utilise pour moduler lestimation du facteur de risque du sujet.
Categorie de sante : I, 1, 2, 3, 4, 5
Avec :
1. Sportif de niveau professionnel
2. Sujet normal
3. Suspicion dischemie et/ou de troubles du rythme
4. Ischemie et/ou troubles du rythme averes
5. Pathologie cardiaque documentee

A.5.2

Facteurs de risque majeurs

Sexe : (M, F, I)
Age :
Tabagie : (Non fumeur, Ex-Fumeur, Fumeur)
Obesite : (O/N)
Diab`ete : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))
Hypertension arterielle : (O/N)
Frequence cardiaque au repos (battements/mn) :
Cholesterol total (mg/dl) :
Fibrinog`enes (mg/dl) :

Annexe A. Dossier Medical Personnel embarque dans le PEM


Nbre de leucocytes (109/l) :
Claudication intermittente : (O/N)

A.5.3

Autres facteurs de risque

Tension arterielle systolique (mm Hg) :


Tension arterielle diastolique (mm Hg) :
Anemie : (O/N)
Maladie des coronaires dorigine anormale : (O/N)
Antecedents familiaux de maladie des coronaires : (O/N)
Antecedents familiaux de mort subite : (O/N)

140

Annexe B
La base de donn
ees INDANA
La base de donnees INDANA (INdividual Data ANalysis of Antihypertensive drug
interventions) reunit les donnees individuelles de 10 essais therapeutiques (controles randomises) conduits pour evaluer lefficacite de traitements anti-hypertenseurs [103].
Les sujets faisant partie de cette base de donnees ont ete suivis, en moyenne, sur une
periode de 5 ans et toute incidence devenements de nature cardiovasculaire a ete releve :
accident vasculaire cerebral, infarctus du myocarde, dec`es par accident vasculaire cerebral,
dec`es par infarctus du myocarde.
Cette base de donnees a ete mise en forme et est maintenue par lUnite de Pharmacologie Clinique de lUniversite Lyon 1 (chef de projet : Francois Gueyffier).

Annexe B. La base de donnees INDANA

142

Tab. B.1 Tableau descriptif des variables et labels de la base de donnees INDANA
Nom
SEX
AGE
BL HEIGH
BL WEIGH
BL BLO U
BL NBCIG
BL HR
BL SBP
BL DBP
BL ECGM1

Label
sexe
age
taille en debut detude
poids en debut detude
hematurie en debut detude
nombre de cigarettes en debut detude
frequence cardiaque en debut detude
pression arterielle systolique en debut detude
pression arterielle diastolique en debut detude
Q/QS Pattern

BL ECGM3
BL ECGM4
BL ECGM5
BL AF
BL GLUC
BL URIC
BL CHOL
BL CREAT
BL GLY U
BL PRT U
BL K
BL SMOKE
BL CATSM
BL UREA
BL BMI
HX DIAB
HX TTHBP
HX HBP
HX ANGIN
HX MI
HX ST
HX CLAUD
ST
MI
DEATH
DEATHMI
DEATHST
DEATHCV

Hypertrophie ventriculaire gauche /ECG


depression du segment ST
inversion de londe T
fibrillation atriale en debut detude
glycemie `a jeun en debut detude
uricemie en debut detude
cholesterol total en debut detude
creatinemie en debut detude
glycosurie
proteinurie
kaliemie
tabagisme en debut detude
tabagisme en debut detude
uree sanguine en debut detude
index ponderal en debut detude
antecedent de diab`ete
antecedent de traitement antihypertenseur
antecedent dhypertension
antecedent dangor
antecedent dinfarctus myocardique
antecedent dAVC
antecedent de claudication
AVC (accident vasculaire cerebral)
IDM (infarctus du myocarde)
dec`es
dec`es par IDM
dec`es par AVC
dec`es cardio-vasculaire

Valeur
0 : femme, 1 : homme
en annees
en cm
en kg
nbre/jour
batt/mn
mmHg
mmHg
( 0 : pas danomalie,
1 anomalie la
moins significative,
2,...x anomalie
la plus significative)
0 : non ; 1 : oui
mmol/l
mmol/l
mmol/l
mmol/l
0 : non 1 :oui
0 : non 1 :oui
mmol/l
0 : non ; 1 :oui
4 categories
mmol/l
kg/m2
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui
0 : non ; 1 : oui

Annexe C
Architecture des r
eseaux de
neurones utilis
es pour la synth`
ese de
lECG
La meilleure configuration en termes darchitecture des reseaux de neurones utilises
pour la synth`ese de lECG standard est determinee experimentalement en effectuant lapprentissage de hnt structures obtenues en faisant varier le nombre de couches cachees
(h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction dactivation (t=lineaire (purelin), sigmode : tangente sigmode (tansig), logarithme-sigmode
(logsig)). Les resultats detailles des performances des hnt structures en termes derreur RMS sur les 100 ECG de la population detude DS1 sont presentes dans les tableaux
ci-apr`es.
Nb de couches cachees
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

Nb de neurones par couche cache Fonctions dactivation


3
tansig
5
tansig
8
tansig
10
tansig
15
tansig
3
logsig
5
logsig
8
logsig
10
logsig
15
logsig
3
purelin
5
purelin
8
purelin
10
purelin
15
purelin

RMS
107.98
94.72
89.87
89.44
87.47
115.52
104.08
96.95
96.27
91.40
100.14
95.26
90.87
90.82
89.63

Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 144
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

Nb de neurones par couche cache Fonctions dactivation


33
purelin tansig
35
purelin tansig
38
purelin tansig
3 10
purelin tansig
3 15
purelin tansig
53
purelin tansig
55
purelin tansig
58
purelin tansig
5 10
purelin tansig
5 15
purelin tansig
83
purelin tansig
85
purelin tansig
88
purelin tansig
8 10
purelin tansig
8 15
purelin tansig
10 3
purelin tansig
10 5
purelin tansig
10 8
purelin tansig
10 10
purelin tansig
10 15
purelin tansig
15 3
purelin tansig
15 5
purelin tansig
15 8
purelin tansig
15 10
purelin tansig
15 15
purelin tansig
33
purelin logsig
35
purelin logsig
38
purelin logsig
3 10
purelin logsig
3 15
purelin logsig
53
purelin logsig
55
purelin logsig
58
purelin logsig
5 10
purelin logsig
5 15
purelin logsig
83
purelin logsig
85
purelin logsig
88
purelin logsig
8 10
purelin logsig
8 15
purelin logsig
10 3
purelin logsig
10 5
purelin logsig
10 8
purelin logsig
10 10
purelin logsig
10 15
purelin logsig
15 3
purelin logsig
15 5
purelin logsig
15 8
purelin logsig
15 10
purelin logsig
15 15
purelin logsig

RMS
117.78
110.47
103.46
101.42
100.84
114.30
103.32
99.24
97.08
94.485
113.30
104.99
96.62
96.03
91.26
113.33
102.28
97.10
95.60
92.09
112.58
101.45
97.96
95.56
90.12
121.66
115.30
110.08
108.10
105.99
119.17
111.17
107.33
104.65
100.16
117.73
112.15
104.04
104.35
97.04
118.9
109.96
104.86
102.33
99.02
117.48
108.28
105.56
103.82
97.31

Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 145
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

Nb de neurones par couche cache Fonctions dactivation


33
purelin purelin
35
purelin purelin
38
purelin purelin
3 10
purelin purelin
3 15
purelin purelin
53
purelin purelin
55
purelin purelin
58
purelin purelin
5 10
purelin purelin
5 15
purelin purelin
83
purelin purelin
85
purelin purelin
88
purelin purelin
8 10
purelin purelin
8 15
purelin purelin
10 3
purelin purelin
10 5
purelin purelin
10 8
purelin purelin
10 10
purelin purelin
10 15
purelin purelin
15 3
purelin purelin
15 5
purelin purelin
15 8
purelin purelin
15 10
purelin purelin
15 15
purelin purelin
33
tansig purelin
35
tansig purelin
38
tansig purelin
3 10
tansig purelin
3 15
tansig purelin
53
tansig purelin
55
tansig purelin
58
tansig purelin
5 10
tansig purelin
5 15
tansig purelin
83
tansig purelin
85
tansig purelin
88
tansig purelin
8 10
tansig purelin
8 15
tansig purelin
10 3
tansig purelin
10 5
tansig purelin
10 8
tansig purelin
10 10
tansig purelin
10 15
tansig purelin
15 3
tansig purelin
15 5
tansig purelin
15 8
tansig purelin
15 10
tansig purelin
15 15
tansig purelin

RMS
110.11
101.46
100.79
99.89
97.14
101.78
96.90
93.12
92.41
89.65
100.15
94.74
92.42
91.91
91.29
97.99
93.75
91.52
89.66
89.32
96.93
92.92
89.76
89.12
90.35
117.41
110.35
106.52
104.34
106.19
105.43
101.04
96.76
94.11
92.29
100.34
93.265
91.50
90.36
90.53
100.75
92.43
89.99
90.37
89.72
96.16
90.46
89.38
87.93
92.54

Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 146
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

Nb de neurones par couche cache Fonctions dactivation


33
tansig tansig
35
tansig tansig
38
tansig tansig
3 10
tansig tansig
3 15
tansig tansig
53
tansig tansig
55
tansig tansig
58
tansig tansig
5 10
tansig tansig
5 15
tansig tansig
83
tansig tansig
85
tansig tansig
88
tansig tansig
8 10
tansig tansig
8 15
tansig tansig
10 3
tansig tansig
10 5
tansig tansig
10 8
tansig tansig
10 10
tansig tansig
10 15
tansig tansig
15 3
tansig tansig
15 5
tansig tansig
15 8
tansig tansig
15 10
tansig tansig
15 15
tansig tansig
33
tansig logsig
35
tansig logsig
38
tansig logsig
3 10
tansig logsig
3 15
tansig logsig
53
tansig logsig
55
tansig logsig
58
tansig logsig
5 10
tansig logsig
5 15
tansig logsig
83
tansig logsig
85
tansig logsig
88
tansig logsig
8 10
tansig logsig
8 15
tansig logsig
10 3
tansig logsig
10 5
tansig logsig
10 8
tansig logsig
10 10
tansig logsig
10 15
tansig logsig
15 3
tansig logsig
15 5
tansig logsig
15 8
tansig logsig
15 10
tansig logsig
15 15
tansig logsig

RMS
122.05
115.65
110.84
108.03
108.32
117.67
111.40
104.12
100.06
96.97
116.08
105.17
100.78
99.05
92.58
114.79
104.51
99.75
95.49
92.54
115.55
105.04
97.74
94.80
91.58
126.31
121.16
115.39
112.54
113.79
120.73
117.93
110.83
106.81
104.96
121.37
111.08
107.47
106.55
100.68
118.47
111.33
106.69
104.07
99.01
119.30
111.37
105.10
102.21
98.76

Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 147
Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

Nb de neurones par couche cache Fonctions dactivation


33
logsig purelin
35
logsig purelin
38
logsig purelin
3 10
logsig purelin
3 15
logsig purelin
53
logsig purelin
55
logsig purelin
58
logsig purelin
5 10
logsig purelin
5 15
logsig purelin
83
logsig purelin
85
logsig purelin
88
logsig purelin
8 10
logsig purelin
8 15
logsig purelin
10 3
logsig purelin
10 5
logsig purelin
10 8
logsig purelin
10 10
logsig purelin
10 15
logsig purelin
15 3
logsig purelin
15 5
logsig purelin
15 8
logsig purelin
15 10
logsig purelin
15 15
logsig purelin
33
logsig tansig
35
logsig tansig
38
logsig tansig
3 10
logsig tansig
3 15
logsig tansig
53
logsig tansig
55
logsig tansig
58
logsig tansig
5 10
logsig tansig
5 15
logsig tansig
83
logsig tansig
85
logsig tansig
88
logsig tansig
8 10
logsig tansig
8 15
logsig tansig
10 3
logsig tansig
10 5
logsig tansig
10 8
logsig tansig
10 10
logsig tansig
10 15
logsig tansig
15 3
logsig tansig
15 5
logsig tansig
15 8
logsig tansig
15 10
logsig tansig
15 15
logsig tansig

RMS
126.65
120.57
115.92
114.46
113.48
116.13
111.22
105.66
102.11
99.47
109.41
102.86
98.09
94.47
93.91
110.20
102.04
95.61
95.74
92.07
101.85
97.26
92.90
91.43
91.55
122.77
114.97
108.59
105.43
104.80
119.26
111.48
103.36
100.10
95.90
118.56
105.08
101.52
99.86
93.03
115.71
105.83
100.65
96.69
92.68
118.88
107.36
99.58
96.40
93.07

Annexe C. Architecture des reseaux de neurones utilises pour la synth`ese de lECG 148

Nb de couches cachees
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

Nb de neurones par couche cache Fonctions dactivation


33
logsig logsig
35
logsig logsig
38
logsig logsig
3 10
logsig logsig
3 15
logsig logsig
53
logsig logsig
55
logsig logsig
58
logsig logsig
5 10
logsig logsig
5 15
logsig logsig
83
logsig logsig
85
logsig logsig
88
logsig logsig
8 10
logsig logsig
8 15
logsig logsig
10 3
logsig logsig
10 5
logsig logsig
10 8
logsig logsig
10 10
logsig logsig
10 15
logsig logsig
15 3
logsig logsig
15 5
logsig logsig
15 8
logsig logsig
15 10
logsig logsig
15 15
logsig logsig

RMS
126.31
120.69
113.88
110.74
111.16
122.06
118.14
110.36
106.14
103.40
122.82
111.39
107.13
105.85
99.45
118.97
112.70
106.20
104.47
98.62
121.73
112.47
106.11
102.59
98.71

Annexe D
SCPECG Processor
Description
Pour faciliter le traitement des ECGs enregistres au format SCP-ECG par les outils
daide `a la decision developpes dans le cadre dEPI-MEDICS, nous avons developpe un
logiciel autonome (stand-alone) intitule SCP-ECG processor (Figure D.1). Ce logiciel
permet danalyser les ECGs par le biais dune serie de modules qui ont ete developpes.
Il est egalement dote dun module daide `a la decision `a base de comites de reseaux de
neurones similaire `a celui developpe dans le chapitre 2 de ce rapport de th`ese et dun
module de synth`ese de lECG par regression generique et specifique. De meme ce logiciel
est concu pour integrer tout autre module danalyse, dinterpretation, ou daide `a la
decision (les modules de reseaux bayesiens, de logique floue, etc.).

Principaux modules int


egr
es
BuildFake10sEcg Ce module simule un enregistrement dECG de 10 secondes
`a partir du complexe median et du rythme cardiaque. Ce module est utile pour
analyser les fichiers SCP-ECP ne contenant que le complexe median.
PermuteFR Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes F et R.
PermuteLF Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes L et F.
PermuteLR Ce module a pour mission de corriger (ou simuler) une inversion des
electrodes L et R.
12-Lead Synthesis Ce module permet `a lutilisateur de choisir la methode de
synth`ese `a employer :
No synthesis : aucune synth`ese nest effectuee.

Annexe D. SCPECG Processor

150

Generic 12-Lead Synthesis : La matrice de synth`ese generique est utilisee. Cette


matrice est actuellement basee sur un mod`ele de regression generique.
Patient Specific Regression : une matrice de synth`ese specifique au patient est
calculee suivant un mod`ele de regression sur lECG concerne.
User Specific ANN Synthesis : une matrice de synth`ese specifique au patient
est fournie.
Compute Typical Beat and global measurements Ce module applique le
programme de Lyon pour calculer les mesures globales de lECG concerne.
Compute Lead by Lead Measurements Ce module applique le programme de
Lyon pour calculer les mesures, derivation par derivation, de lECG concerne.
Output File to Write Suivant la selection effectuee par lutilisateur, le logiciel
gen`ere differents fichiers en sortie : un nouveau fichier SCP-ECG de lECG, les
mesures globales, les mesures derivation par derivation, les donnees apr`es analyse
en composantes principales de lECG et le resultat de linterpretation de lECG par
comites de reseaux de neurones.

Annexe D. SCPECG Processor

Fig. D.1 Ecran de configuration du logiciel SCP-ECG processor.

151

Annexe E
EPI-MEDICS : mod`
eles de donn
ees
globaux du PEM

Annexe E. EPI-MEDICS : mod`eles de donnees globaux du PEM

153

Annexe E. EPI-MEDICS : mod`eles de donnees globaux du PEM

154

Annexe F
Publications
Revues internationales avec comit
e de lecture
H. Atoui, D. Sarrut, S. Miguet. A Fast Morphing-Based Interpolation For Medical Images : Application To Conformal Radiotherapy. Image Anal Stereol, 2006 ;
25(2) :95-103.
H. Atoui, J. Fayn, P. Rubel. A Novel Neural Network Model for Deriving Standard
12-lead ECGs from serial 3-lead ECGs. Application to Self Care. Submitted to
Methods Inf Med.
P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, L. Restier, S. Adami, S. Arod, H.
Atoui, et al. Toward personal eHealth in cardiology. Results from the EPI-MEDICS
telemedicine project. J Electrocardiol, 2005 ;38 :100-106.

Revues nationales avec comit


e de lecture
P. Rubel, J. Fayn, H. Atoui, et al. Intelligence Ambiante et Syst`emes Pervasifs
en Telemedecine. Exemple dApplication en Telecardiologie. La Revue des SAMU,
2004 ;26 :521-26.

Chapitre dans un livre


P. Rubel, J. Fayn, L Simon-Chautemps, H. Atoui, et al. New paradigms in Telemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. Stud Health
Technol Inform. 2004 ; 108 :123-32.

Annexe F. Publications

156

Conf
erences internationales avec comit
e de lecture
H. Atoui, J. Fayn, F. Gueyffier, and P. Rubel. Cardiovascular Risk Stratification
in Decision Support Systems, A Probabilistic Approach. Application to pHealth.
Accepted for publication in Computers in Cardiology 2006.
H. Atoui, J. Fayn and P. Rubel. A Neural Network Approach for Patient-specific
12-lead ECG Synthesis in Patient Monitoring Environments. In : Murray A., Ed.,
Computers in Cardiology, Los Alamitos (USA) : IEEE Computer Society, 2004 ;
31 :161-64.
H. Atoui, D. Sarrut, S. Miguet. Usefulness of Image Morphing Techniques in Cancer Treatment by Conformal Radiotherapy. In : Robert L. Galloway, Ed., Medical
Imaging : Visualization, Image-Guided Procedures, and Display, 2004 ; 5367 :332-40.
J. Fayn, C. Ghedira, D. Telisson, H. Atoui, P. Rubel, et al. Towards New Integrated Information and Communication Infrastructures in eHealth. Examples from
Cardiology. In : Murray A., Ed., Computers in Cardiology, Los Alamitos (USA) :
IEEE Computer Society, 2003 ; 30 :113-16.

Conf
erences internationales invit
ees
P. Rubel, J. Fayn, H. Atoui, D. Telisson, P. Chevalier. From eHealth to Pervasive
Solutions and Ambient Intelligence in pHealth. An International Perspective with
Examples from Cardiology. International Initiative for Ubiquitous Healthcare (uHealth), Med-e-Tel, Luxembourg, April 5-7, 2006.
H. Atoui, J. Fayn, P. Rubel. Advanced methods of data fusion of ECG and clinical
data for self-care diagnosis enhancement. 6th STAFF Studies Symposium. September 28 - October 1, 2005.
P. Rubel, J. Fayn, H. Atoui, et al. Pre-hospital acute decision support. 6th STAFF
Studies Symposium. September 28 - October 1, 2005.
J. Fayn, H. Atoui, P. Rubel, et al. Embedded decision making in eCardiology.
Lessons learned from the EPI-MEDICS project. International Workshop on Personalised Health, Belfast, December 13-15, 2004.
P. Rubel, J. Fayn, H. Atoui, D. Telisson. Beyond EPI-MEDICS. In Proceedings of
the 2nd OpenECG Workshop. Integration of the ECG into the EHR & Interoperability of the ECG Device Systelms. Berlin, Germany, April 1-3, 2004 :75-6.
P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al. New paradigms in Telemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. eHealth
Workshop : New generation of wearable systems for health : Towards a revolution
of citizens health and life style management ? Lucca, Italy, December 12-14, 2003.

Annexe F. Publications

157

Conf
erences nationales avec comit
e de lecture
H. Atoui, D. Telisson, et al. Detection precoce devenements cardiaques en selfcare. Architecture fonctionnelle de la plateforme daide `a la decision par reseaux
de neurones du projet europeen EPIMEDICS. Journees Sciences, Technologies et
Imagerie pour la Medecine, Nancy, 2005 : 13-14.

Conf
erences ou journ
ees th
ematiques nationales
H. Atoui. Conception de syst`emes intelligents pour la telemedecine citoyenne. Rencontres Regionales de la Recherche, Lyon, 2004 (poster).

S
eminaires
Techniques dimagerie pour laide au positionnement du patient en radiotherapie
conformationnelle. Octobre 2002. Laboratoire ERIC

Conception de Syst`
emes Intelligents pour la T
el
em
edecine
Citoyenne
Hussein ATOUI
R
esum
e

Ces recherches sinscrivent dans la continuite du projet europeen EPIMEDICS (Enhanced Personal Intelligent & Mobile system for Early Detection & Interpretation of Cardiovascular Syndromes) du programme Information Society Technologies,
qui a pour objectif la realisation dun moniteur personnel dECG (PEM) intelligent, dote
dun serveur embarque et dun composant metier danalyse quantitative de lECG, compact, portable et utilisable par tous, y compris par le patient lui-meme, un aidant, ou
nimporte quel citoyen. Le PEM est capable denregistrer un ECG 3D simplifie contenant la quasi-totalite des informations spatio-temporelles produite par lactivite du cur
et capable denvoyer par GPRS ou UMTS differents types de messages ou dalarmes
convoyant des ECG et un mini-dossier medical de lutilisateur. Cest dans ce contexte que
nous avons cherche `a ameliorer lintelligence du syst`eme en developpant une plateforme
auto-adaptative et auto-evolutive de detection automatique des dysfonctionnements du
coeur. Cette plateforme permet de stratifier le risque de la survenue dun ev`enement cardiovasculaire moyennant linterpretation de lECG combinee avec lhistorique medical de
lutilisateur.
Laide au diagnostic consiste `a mettre en oeuvre des algorithmes resolvant un probl`eme de
classement compte tenu de lincertitude sur la situation reelle de lobjet etudie. Les travaux
presentes dans ce memoire etudient differents aspects de cette tache. Tout dabord, nous
proposons une modelisation du processus de diagnostic de linfarctus `a partir de lECG.
Linterpretation automatique de lECG est effectuee `a laide de comites de reseaux de
neurones artificiels. Une serie dexperimentations illustre la superiorite des reseaux de
neurones par rapport aux resultats obtenus par des cardiologues interpretant le meme ensemble de donnees. Ensuite, afin dobtenir un diagnostic plus precis et plus personnalise,
nous proposons dinclure une stratification des informations cliniques de lutilisateur telles
que les facteurs de risque. Notre approche consiste `a utiliser les reseaux bayesiens pour
etablir une quantification probabiliste du risque cardiovasculaire. Nous proposons enfin
un algorithme permettant de fusionner le score de linterpretation de lECG realisee par
les reseaux de neurones avec celui obtenu par les reseaux bayesiens `a partir des facteurs
de risque. Cette fusion constitue lun des fondements de la future plateforme daide `a la
decision qui sera embarquee dans le PEM, syst`eme qui sera `a la fois auto-adaptatif en
fonction de la specificite de chaque utilisateur et auto-evolutive grace au potentiel dapprentissage automatique des reseaux de neurones et des reseaux bayesiens.
Dans la deuxi`eme partie de cette th`ese, nous etudions un formalisme permettant de rendre
lECG simplifie du PEM accessible, sous un format comprehensible et interpretable, aux
professionnels de sante. Il sagit de synthetiser un ECG standard 12D `a partir de lECG
3D du PEM. Cette synth`ese doit permettre non seulement une detection precise, mais
egalement une reproduction la plus fid`ele possible des caracteristiques de lECG standard
si ce dernier avait ete enregistre simultanement avec lECG 3D du PEM. Cest la raison
pour laquelle nous nous sommes orientes vers des techniques dintelligence artificielle mettant en uvre une methode originale de reconstruction des ECG basee sur lutilisation
de comites de reseaux de neurones. Une serie de tests sur des bases de donnees dECG
standards et dECG PEM enregistres dans des conditions simulant celles dutilisation du
PEM, a montre que notre approche a largement depasse les methodes conventionnelles.
Enfin, nous avons travaille sur la conception de strategies de deploiement pour la mise en
uvre de methodes de synth`ese de lECG specifique `a chaque patient au moyen dinfrastructures ad hoc permettant de realiser lapprentissage neuronal `a grande echelle, grace
aux technologies des services web et des grilles de calcul.
Mots cl
es Syst`emes pervasifs - Intelligence ambiante - Intelligence artificielle - Fusion
de donnees - Aide `a la decision - Telemedecine citoyenne

Das könnte Ihnen auch gefallen