Sie sind auf Seite 1von 73

Universit de Tunis Institut Suprieur de Gestion Dpartement Informatique

Mmoire de fin dtudes


Pour lobtention du diplme de

Licence Fondamentale En Informatique de Gestion Aide la Dcision Mdicale pour la Prise en Charge des Patients ayant La Paralysie Faciale

Ralis par :
SAKOUHI Thouraya

Encadr par :
Dr. AKAICHI Jalel

Anne Universitaire 2010/2011

Ddicaces
Je ddie ce modeste travail :

A Mes chers parents

Pour leurs encouragements et leurs sacrifices tout au long de mes tudes. Que Dieux leurs rserve bonne sant et longue vie
A Mes surs Hayet et Mouna

Avec tout mes souhaits de succs

A Tous mes amis

Aucun chemin de fleurs ne conduit la gloire.

Thouraya

Remerciements
Nos remerciements les plus chaleureux sadressent notre encadreur Docteur Jalel Akaichi pour sa disponibilit, son assistance, son aide et ses prcieux conseils au cours de la ralisation de ce travail.

Nos vifs remerciements sadressent, galement, tous Nos enseignants pours les efforts dploys au cours de notre formation.

Enfin, nous tenons prsenter notre gratitude aux Membres du jury qui ont pris la peine dvaluer ce travail.

Sakouhi Thouraya

TABLES DE FIGURES

FIGURE 1 : CAS DUTILISATIONS DE LACTEUR MEDECIN ..................................................................... 14 FIGURE 2 : CAS DUTILISATION DE LACTEUR INFIRMIER ..................................................................... 16 FIGURE 3 : CAS DUTILISATION DE LACTEUR TECHNICIEN LABO .......................................................... 17 FIGURE 4 : CAS DUTILISATION DE LACTEUR EQUIPE DE RECHERCHE .................................................. 18 FIGURE 5 : DIAGRAMME DE CLASSES GENERAL .................................................................................. 22 FIGURE 6 : SCHEMA EN ETOILE DE LENTREPOT DE DONNEES ............................................................. 28 FIGURE 7 : SCHEMA EN FLOCON DE NEIGE DE LENTREPOT DE DONNEES ............................................ 30 FIGURE 8 : SCHEMA EN CONSTELLATION DE LENTREPOT DE DONNEES 1 ............................................ 31 FIGURE 9 : SCHEMA EN CONSTELLATION DE LENTREPOT DE DONNEES 2 ............................................ 32 FIGURE 10 : SCHEMA DE LARCHITECTURE GENERALE DU DATA WAREHOUSE...................................... 36 FIGURE 11 : SCHEMA DUNE TRANSFORMATION DANS LINTERFACE SPOON ....................................... 37 FIGURE 12 : EXTRACTION DEPUIS UN FICHIER EMPLACEMENT DU FICHIER SOURCE ...................... 37 FIGURE 13 : EXTRACTION DEPUIS UN FICHIER ADAPTER AU CONTENU DU FICHIER ....................... 38 FIGURE 14 : EXTRACTION DEPUIS UN FICHIER RECUPERATION DES CHAMPS ................................. 38 FIGURE 15 : EXTRACTION DEPUIS UN FICHIER PREVISUALISATION DE DONNEES ........................... 39 FIGURE 16 : INTERFACE POUR EDITER LETAPE INSERTION DANS TABLE ......................................... 39 FIGURE 17 : INSERTION DANS TABLE CONFIGURATION DE LA CONNEXION ..................................... 40 FIGURE 18 : INSERTION DANS TABLE RECUPERATION DES CHAMP .................................................. 40 FIGURE 19 : INSERTION DANS TABLE: REQUETE SQL ...................................................................... 41 FIGURE 20 : EXECUTION DE LA TRANSFORMATION ............................................................................. 41 FIGURE 21: ETAPES POUR ALIMENTATION DE LA TABLE FAIT .............................................................. 42 FIGURE 22: EXTRACTION DEPUIS TABLE ............................................................................................. 43 FIGURE 23 : RECHERCHE DANS LA BASE DE DONNEES ......................................................................... 43 FIGURE 24 : INSERTION/MAJ DANS TABLE .......................................................................................... 44 FIGURE 25 : PREVISUALISATION DE DONNE ....................................................................................... 44

FIGURE 26: CONFIGURATION DE LA CONNEXION A LA SOURCE DE DONNEES ....................................... 45 FIGURE 27 : EXPLORATEUR DE BASE DE DONNEES .............................................................................. 46 FIGURE 28 : STRUCTURE DU SCHEMA ................................................................................................. 47 FIGURE 29 : EDITEUR CODE XML ........................................................................................................ 47 FIGURE 30 : EXECUTION DE LA REQUETE MDX .................................................................................... 48 FIGURE 31 : CONNEXION A LA SOURCE DE DONNEES .......................................................................... 49 FIGURE 32 : QUERY DESIGNER ........................................................................................................... 50 FIGURE 33 : RAPPORT LISTE PATIENTS ............................................................................................... 51 FIGURE 34 : RAPPORT NOMBRE TESTS EFFECTUES PAR PATIENT ......................................................... 53

TABLE DE MATIERES

1. INTRODUCTION GENERALE ............................................................................................................. 1


1.1.CONTEXTE .............................................................................................................................................................................. 1 1.2.PROBLEMATIQUE ..................................................................................................................................................................... 2 1.3.CONTRIBUTIONS ...................................................................................................................................................................... 2 1.4.PLAN DU RAPPORT ................................................................................................................................................................... 3

2. ETAT DE L'ART................................................................................................................................. 4 3. MODELISATION CONCEPTUELLE .................................................................................................... 12


3.1.SPECIFICATION DES BESOINS..................................................................................................................................................... 12 3.2.PRESENTATION DU LANGAGE DE MODELISATION........................................................................................................................... 13 3.3.DESCRIPTION DU LOGICIEL DE MODELISATION RATIONAL ROSE........................................................................................................ 14 3.4.CAS DUTILISATION PRINCIPAL DUN SYSTEME OPERATIONNEL ET DECISIONNEL MEDICAL ...................................................................... 14 3.4.1.ACTEUR MEDECIN............................................................................................................................................... 14 3.4.2.ACTEUR INFIRMIER ............................................................................................................................................. 16 3.4.3.ACTEUR TECHNICIEN LABO ................................................................................................................................. 17 3.4.4.ACTEUR EQUIPE DE RECHERCHE ........................................................................................................................ 18 3.5.CONCEPTION DE LA BASE DE DONNEES SOURCE .......................................................................................................................... 20 3.6.CONCEPTION DE LENTREPOT DE DONNEES DU SYSTEME DECISIONNEL .............................................................................................. 23 3.6.1.PRESENTATION DUN SYSTEME DECISIONNEL ................................................................................................... 23 3.6.2.GLOSSAIRE DE LINFORMATIQUE DECISIONNELLE ............................................................................................. 24 3.6.3.SCHEMA EN ETOILE ............................................................................................................................................ 28 3.6.4.SCHEMA EN FLOCON DE NEIGE .......................................................................................................................... 29 3.6.5.SCHEMA EN CONSTELLATION ............................................................................................................................. 31

4. IMPLEMENTATION ET EXPERIMENTATION .................................................................................... 33


4.1.DESCRIPTION DE LENVIRONNEMENT DE DEVELOPPEMENT.............................................................................................................. 33 4.1.1.MYSQL SERVER 5.1 ............................................................................................................................................. 33

4.1.2.PENTAHO BI ........................................................................................................................................................ 33 4.1.3.PENTAHO DATA INTEGRATION ........................................................................................................................... 34 4.1.4.PENTAHO SCHEMA WORKBENCH ....................................................................................................................... 34 4.1.5.JASPERSOFT IREPORT ........................................................................................................................................ 34 4.2.REALISATION ..................................................................................................................................................................... 35 4.2.1.CONSTRUCTION DE LENTREPOT DE DONNEES .................................................................................................. 35 4.2.2.ANALYSE DE LENTREPOT DE DONNEES ............................................................................................................. 45 4.2.3.REPORTING ......................................................................................................................................................... 49

5. CONCLUSION ET PERSPECTIVES ..................................................................................................... 54 6. LES REFERENCES BIBLIOGRAPHIQUES ............................................................................................ 55


BIBLIOGRAPHIE............................................................................................................................................................................ 55 NETO-GRAPHIE............................................................................................................................................................................ 58

1. INTRODUCTION GENERALE

1.1.

CONTEXTE

Le domaine mdical de nos jours a beaucoup volu aussi scientifiquement que technologiquement. Le dossier patient est informatis et l'information est stocke sur plusieurs supports do la complexit de la tache de rcupration de ces donnes. L'accs aux donnes travers les applications n'tait pas une tache aussi facile et rapide depuis longtemps. En 1970, les mainframes n'taient pas facilement accessibles. Au dbut des annes 80, il y avait les systmes de gestion de base de donnes distribus, encore des difficults en tirant les donnes du systme. En 1990, il y avait lavnement des entrepts de donnes d'entreprise (EDE) et des magasins de donnes qui sont optimiss pour l'analyse. Un entrept de donnes est une collection de donnes orientes sujet, intgres, non volatiles et historises, organises pour le support dun processus daide la dcision [1]. Chaque unit de donnes est pertinente un certain moment dans le temps. Un entrept de donnes contient des donnes atomiques et lgrement rsumes. Les Data Marts sont des sous ensembles de lentrept de donnes que sont organiss par sujet et optimiss pour appuyer les rapports et l'analyse. En fait, les fournisseurs de soins de sant, les chercheurs cliniques et les administrateurs de l'hpital ont besoin d'accder diffrents types de donnes cliniques et administratives. Ces derniers ont besoin de donnes de patients compltes, actuelles, mises jour, prcises et longitudinales dans des objectifs de prise de dcision sanitaire efficace, la recherche et l'amlioration des processus tel que: la modlisation des processus de sant, modlisation des connaissances cliniques pour les systmes d'aide la dcision, bioinformatique, la recherche pharmaceutique, etc. Dans ce travail, nous nous intressons lintgration de donnes mdicales et nous proposons une solution consistant en la cration dune source de donnes intgre pour faciliter l'analyse des donnes ou ce qu'on appelle entrept de donnes (ED). Un ED mdical peut contenir des donns tel que : des donnes de patients et de visites, donnes oprationnelles, donnes cliniques, donnes financires, donnes de recherche, etc. L'utilisation des entrepts de donnes comme solution pour l'aide la dcision datent du dbut des annes 80, les termes ''dimensions'' et ''faits'' ont t crs par General Mills et l'Universit Dartmouth pendant les annes 1960.

1.2.

PROBLEMATIQUE

La Paralysie Faciale est une maladie affectant le nerf facial qui, malgr les techniques qui sont utiliss pour acclrer le recouvrement, un traitement efficace nest pas encore bien dfinit. Afin damliorer la connaissance mdicale de cette maladie, mdecins, chercheurs cliniques et administrateurs ont besoins de l'information dans des objectifs de prise de dcision sanitaire. Vu les diffrentes sources de donnes cliniques, une programmation extensive est exige pour extraire et intgrer l'information chaque fois que celle-ci est demande. Ceci engendre un retard de livraison de l'information ceux qui en ont besoin. Les systmes d'informations oprationnels sont non fiables. En effet, ils existent multiples sources de donnes mais qui sont parcellaires, catgorielles et non coordonnes. L'information est htrogne et localise dans diffrents emplacements: structure et non structure, en diffrents formats et non conformes. En revanche, les concepts de soins de sant manquent de structure formelle, aucune reprsentation standard qui peut tre entre dans les formules et les modles n'existe, il y a un grand besoin de forme canonique et de vocabulaires normaliss, afin qu'on puisse identifier les concepts quivalents. L'information disponible dans les bases de production manque de qualit gnrale et smantique. Du cot, ces problmes peuvent nuire la qualit des donnes acquises ce qui obre la ralisation d'tudes et d'analyses mdicales.

1.3.

CONTRIBUTIONS

Ce projet est ralis dans le but de concevoir et crer un entrept de donnes d'aide la dcision mdicale dans le domaine de la paralysie faciale pour aider l'utilisateur qui est un mdecin, un chercheur ou un analyste extraire les donnes utiles contenues dans le systme et les exploiter efficacement pour comprendre et amliorer les pratiques des standards des soins de cette maladie.

1.4.

PLAN DU RAPPORT

Le plan du mmoire est organis comme suit: Le chapitre 2 est consacr l'tat de l'art en voquant les diffrents travaux de recherche raliss relatifs au domaine d'aide la dcision mdicale. Le troisime chapitre prsente la modlisation conceptuelle de la base de donnes source et de lentrept de donnes. Par la suite vient le quatrime chapitre contenant la prsentation de larchitecture logicielle utilise, l'implmentation et la mise en uvre de la solution. Le cinquime et le dernier chapitre rsume et conclut ce mmoire et prsente les perspectives de recherche dans ce domaine.

2. ETAT DE L'ART

Un ED est une base du type OLAP (On Line Analatical Processing ou traitement analytique en ligne) alimente en provenance de la base de production disponible dans le systme dinformations. En fait, les donnes entreposes sont intgres dans des modles multidimensionnels organiss selon le sujet analys, appel fait, et des axes danalyse, appels dimensions. Les entrepts de donnes et les systmes OLAP sont de plus en plus utiliss car ils proposent des architectures et des outils pour organiser, analyser et exploiter de grands volumes de donnes et amliorer ainsi la prise de dcision. Dans ce travail nous nous intressons plus particulirement aux ED mdicales. Plusieurs travaux ont t proposs pour rsoudre le problme de lhtrognit des donnes dans le domaine mdical travers les entrepts de donnes. Certains travaux tels que lED pour laide la dcision sanitaire [2] prennent en compte la dure de vie potentielle dun entrept et lvolution des besoins durant la tache de la conception du schma de lentrept. Cette phase prend en considration aussi la structure dimensionnelle approprie pour crer un design hirarchique. SIMS-REIN est un programme dintrt commun ddi aux malades, professionnels de sant, dcideurs et institutions. Ce projet prend en charge la construction de toute une architecture du type ntiers intgrant un ED centr patient pour une meilleure apprhension de la situation et satisfaire les besoins en IRT. Les principaux objectifs du schma de lED es de permettre une tude pidmiologique particulire (filire de soin) et globale (rgionale et nationale). Donc on a choisi la granularit la plus fine possible pour permettre une structure susceptible voluer plus facilement et permettant de sadapter le plus aux contraintes de lanalyse qui exige des niveaux de granularit distincts. Il y a 2 grandes catgories dutilisateurs du systme : les chercheurs et les responsables de sant, et les mdecins fournissant les donnes. Pour cela, lors de la conception de lED des vues persistantes ont t prdfinis pour rpondre aux requtes les plus attendues. Ces vues sont mises jour lors de lalimentation. Les donnes provenant de la base de production sont alimentes par saisie directe. Lextraction est effectue laide doutils JDBC, puis, enrichir smantiquement les mtadonnes extraites. Le processus dalimentation est dclench des intervalles de temps rguliers, fonctionnant par lots de

donnes. Chaque dclenchement les donnes consolides depuis la dernire alimentation sont incorpors dans lED. Par la suite, on valide lalimentation si lintgralit du lot de donnes a pu tre interprte sans erreurs. Lalimentation continue se refaire jusqu ce quaucune erreur ne se produise. Les donnes de lentrept sont prsentes aux utilisateurs partir du serveur pidmiologique. En plus de a, des tableaux de bord et des reprsentations graphiques sont disponibles. Une exportation de donnes au format XML est possible. Les auteurs dans [3] caractrisent l'ED comme une solution efficace aux problmes cits auparavant pour rpondre aux besoins du centre de soins de sant de contenir les cot et en mme temps maintenir ou amliorer la qualit clinique des soins, et ceux suite la cration du modle de soin gr intgrant un data warehouse pour fournir les ressources de donnes. Suite ce changement, diffrentes catgories d'analyses de soins de sant l'aide de requtes multidimensionnelles complexes au niveau financier, administratif et clinique sont supportes. Selon cet article, les prochaines res d'analyses de soins de sant supporteront : une qualit d'valuation des soins, des tudes d'utilisation, des analyses des rsultats et des gestions des maladies. CP-NEXUS DATABASE est un ED cr par CPMC utilise le meilleur des composantes du SI pour accomplir cette tache : un SAS SYSTEM compos de SAS/ACCESS, SAS/SHARE et SAS/CONNECT, en collaboration avec SYSBASE V11 SQL SERVER et une architecture client/serveur adquate. Le processus de construction de l'ED reprsente la 1re phase d'une solution data warehouse de soin de sant intgre. La phase de suite implique une couche d'outils de requtes pour transformer la grande quantit de lignes de donnes en information actionnable. Cette couche va contenir une collection d'applications cibls sujets, requtes guides, cration de rapports, requtes de donnes actives Web et des outils d'analyse bases clients. Cette architecture vise : - Amliorer les rsultats patient et cots - Utiliser la connaissance du la qualit d'analyse - Utilisation efficace des ressources

CP-NEXUS est un outil stratgique supportant l'information base gestion qui fournit de la valeur clinique aux patients et valeur financire aux acheteurs de soins de sant. La solution data warehouse propose par NLL [4] ATOS Origin a t entran par le manque d'adaptabilit des systmes d'informations oprationnels aux contraintes confronts. Cette solution a t ralise pour diminuer l'effort manuel, amliorer la flexibilit et surveiller la performance. Norbotten est une rgion du nord du sude et corps politique dont les principales affaires sont: sant, mdecine et dentisterie. Pour cela cette dernire vise amliorer ces services dans ces domaines en fournissant des services conformes aux besoins des individus, personnel comptent et un choix correct des traitements. Dans le temps, il y avait 7 bases de donnes diffrentes, une par administration. L'information est capture des interfaces vers le systme. Maintenant, l'information est charge, intgre et transforme puis stocke dans l'ED, structur en schma en toile. L'information disponible dans l'ED aux utilisateurs: les mesures de soin de sant (cas, occasions d'oprations, nombre total de lits,..), les classes de soins de sant (classer les mesures) (soins de premire ligne, soins spciales). Prcdemment pris en charge par les systmes d'information oprationnels, la fonctionnalit Reporting est maintenant mene par le Data Warehouse. L'effort manuel a diminu comme c'est prvu concernant les rapports mensuels et trimestriels. En revanche, l'information est plus facilement accessible et l'utilisateur a une vue d'ensemble de la qualit et de la quantit de l'information disponible. L'intgration de l'information mdicale provenant de plusieurs sources est devenue une tache critique. Du cot, les groupes mdicaux tentent de gagner de nouvelles ides des donnes du patient existantes. Et dans ce contexte, le travail de recherche [5] a t intress par la qualit de l'information existante. Un autre dfi se posant aux crateurs de systmes conus pour le partage de l'information patient, c'est la protection de l'intimit du patient lui-mme. Comme solution propos pour cette problmatique de confidentialit des donnes patient, on propose de supprimer l'identificateur patient en chargeant les donnes dans l'ED, car celui-ci sera visible par toutes les parties en ont besoin.

Cette solution est bnfiques pour des raisons multiples: permettre des requtes ad hoc et des analyses complexes avec des trabits de donnes cliniques dtailles, supporte les analyses cliniques itratives et volutivit de la solution. Selon le cas tudi par les auteurs du [6], le but est de crer un ED servant de rfrentiel central de donnes cliniques, intgrant les les isols d'informations, fournir des rapports inter-fonctionnels et des outils d'analyse pour les units fonctionnelles du systme de sant, visant la comprhension et l'amlioration des pratiques des standards de soins. Le Data Warehouse pour les fournisseurs de soin de sant ralis par Plural Soft, s'est engag analyser les informations courantes et futures pour permettre la surveillance de la maladie et la qualit des rapports pour les autorits de rgulation. Les dossiers des patients sont demands par les mdecins, analystes statistiques et les groupes d'analyse de contrle de qualit pour des fins d'tudes. La recherche d'un dossier mdical prend 17minutes par thme, par contre, aprs l'implmentation du Data Warehouse, la recherche se fait en 2 minutes, do rduction des cots et du temps ncessaires pour l'accs aux donnes, ce qui fournit le temps ncessaire la communaut analytique pour analyser le contenu des donnes des dossiers mdicaux. Le travail de recherche Entreprise Data Warehouse [7] prsente une stratgie, architecture, design et l'implmentation d'un ED clinique de recherche. L'objectif est de crer une base et une infrastructure pour supporter la mdecine personnalise dans un rseau affili de fournisseurs et de partenaires. Ce programme fournit des rapports intgrs et un Framework analytique pour permettre l'analyse d'une grande varit de donnes cliniques provenant de diffrentes sources de l'entreprise tendue. En fait, cet Entreprise Data Warehouse soutient les objectifs primaires du Centre de Cancrologie pour le soin du patient et la recherche clinique. Les paramtres critiques et les observations sur les expriences de chaque patient et les diffrents aspects de la performance de l'entreprise sont capturs dans le cadre des oprations normales et continues. Les donnes critiques sont captures, intgrs et prsents d'une faon consistante et cohrente pour aider les chercheurs, les analystes et les dcideurs mesurer et amliorer les rsultats du patient en facilitant l'accs aux diffrents traitements, programmes de prventions, examens et tudes cliniques. De ce fait, le rfrentiel de donnes intgres doit tre prsent par une plateforme comprhensible et adaptative pour permettre l'avancement de la recherche et la thrapeutique.

Le programme implment doit tre souple pour voluer dans le temps comme le fait l'utilisateur. Le design et la construction du rfrentiel de donnes de base a t labor et mis en uvre suivant une srie de phases distinctes et successives. Dans une 1re tape, fallait identifier donnes et les exigences techniques des divers groupes d'utilisateurs, formuler une vision globale de la solution pour supporter les objectifs de l'entreprise, par la suite, faire un plan d'implmentation multi phases. Durant la 2me phase, les premires sources de donnes dj identifies, l'infrastructure de base pour extraction, transformation et chargement dans les diffrentes composantes du rfrentiel est conue et implmente. Les composantes de conception critique permettent une smantique cohrente entre source de donnes et domaines introduits. L'architecture de base de rassemblement de donnes, les stocks oprationnels, ED de base et Data Marts ont t conus, implment et remplis. Dans une 3me phase, les nouvelles fonctions, les sources de donnes et les domaines sont incorpors dans le rfrentiel de base. Les utilisateurs accdent aux donnes utilisant leurs outils et applications prfrs. Oracle Healthcare Provider Intelligence [8] est une solution Data Warehouse supportant les besoins des hpitaux pour rassembler l'information de qualit des systmes oprationnels vers un seul ED. Cette solution fournit une vue comprhensible de l'information clinique tout les niveaux de direction, une rduction du temps d'implmentation et des cots de dveloppement. Les fournisseurs de soins de sant exigent de grandes quantits d'informations pour leurs oprations financires et leur efficacit clinique. Do l'intrt du Healthcare Provider Intelligence d'acclrer un projet informationnel dans le secteur de Healthcare. Afin d'optimiser les ressources financires, humaines et matrielles, les responsables de soins de sant on besoin de prendre des dcisions complexes. Pour cela il est ncessaire d'avoir une vision intgre de l'information simple et rapide. Cette solution dfinit une reprsentation multidimensionnelle de l'information, un accs bas Web l'ED. Les utilisateurs peuvent crer, excuter et manipuler les rapports facilement en respectant chacun son niveau de scurit, en plus de leurs permettre d'obtenir des donnes agrges et d'accder aux informations de qualit du systme oprationnel un rythme plus rapide. Les donnes critiques sont charges dans l'ED dans un temps quasi-rel.

Une 1re version de HPI peut tre implmente rapidement avec un minimum de modification. Dans ce cas, le seul aspect redvelopper est l'extraction du systme source dans la zone de rassemblement, le processus de transformation entre la zone de rassemblement et le modle de donnes multi dimensions est une complexit dj trait. Le travail de recherche [9] dveloppe un Data Waehouse mdical ou pidmiologique orient patient. Comme les donnes clients sont propages dans diffrentes structures de sant, cette solution a des exigences spciales par rapport aux projets de data warehousing l'intra structure de soins de sant. La diffrence est que les structures de soin de sant impliques dans un projet Data Warehouse orient patient exigent certaines considrations sur la confidentialit des donnes du patient et des activits des structures de soins de sant. Les structures de soins de sant veulent prserver la confidentialit des donnes de leurs patients pour des raisons conomiques, comme la tenue des patients en tant que de leurs clients. La construction d'un systme de Data Warehousing un niveau rgional, par exemple en cancrologie, exige la participation de toutes les structures de sant concernes, ainsi que diffrents professionnels de sant. L'htrognit des sources de donnes mdicales doit tre prise en compte pour choisir entre plusieurs configurations organisationnelles du systme d'entreposage de donnes. En outre de l'entreposage de donnes, on a propos le concept de l'Intranet virtuel, qui fournit une solution au problme de la scurit de l'information mdicale dcoulant de sources htrognes. On a dvelopp une architecture Epidware [10], bas sur le concept de Data Warehousing (Entreposage de donnes) pour supporter la collection et l'intgration des donnes des diffrents partenaires de soin de sant : les hpitaux publics et privs, les laboratoires anatomopathologiques, et les bureaux de consultants privs. Ces partenaires ont souvent recours diffrents systmes de codification et de classification pour coder leurs donnes. L'intgration des donnes dans l'entrept est une tache complique par le fait que le choix doit tre fait entre l'utilisation d'un systme de classification unique ou de conserver les donnes dans leur format d'origine. Dans le premier cas, la transcription des donnes est ncessaire que, dans ce dernier cas, les requtes de donnes doivent prendre en compte chaque code existant dans l'entrept.

D'autre part, l'architecture organisationnelle d'aide la dcision dpend de l'accord des partenaires et des fonctions assignes au systme. Il faut tenir compte des souhaits des partenaires dans la gestion et l'analyse de leurs donnes respectives. S'ils acceptent de regrouper leurs informations avec d'autres, il reste encore le choix entre un entrept de donnes global ou un par thme spcifique. En outre, la confidentialit des activits des structures de soins de sant et des statuts personnel, social et mdical du patient doit tre assure. L'architecture gnrale du systme intgr Epidware se compose de 3 niveaux. Le niveau infrieur est consacr aux sources d'information pouvant avoir diffrents formats: les systmes de base de donnes, systmes de fichiers, des documents HTML ou des bases de connaissances Le niveau intermdiaire comprend un groupe de composants appels "enveloppes" qui offrent trois fonctions principales: la traduction, le suivi et l'anonymat. Le niveau suprieur est constitu de l'intgrateur et de l'entrept de donnes dont la fonction principale est de charger les donnes dans le systme d'entreposage de donnes. Il doit filtrer, affiner, intgrer et combiner les informations provenant des sources locales. Pour modliser la structure de donnes cible, les concepteurs doivent tablir, avec l'aide de l'entreprise ou une institution, un dictionnaire de descriptions de donnes (mta donnes) et spcifier des outils pour extraire, traduire et intgrer les donnes provenant des diffrentes sources d'information (bases de donnes initiale). Cela ncessite des techniques d'intgration de concilier les diffrences smantiques entre le les structures de donnes et les bases de donnes sous-jacentes. Une fois le schma cible est implment, l'entrept de donnes doit tre mis jour pour tre sur que le format de donnes correspond aux besoins de l'utilisateur pouvant changer plus tard. En outre, les changements dans les sources d'information doivent tre propags sur l'entrept de donnes. Enfin, les donnes des bases de donnes source sont extraites, agrges et filtres pour harmoniser leurs formats et liminer les redondances. Avant de charger des donnes dans l'entrept de donnes, des valeurs cohrentes sont assignes des variables ou des champs qui ne peuvent pas tre initialis partir des systmes locaux. Priodiquement, extraire et de copier les donnes des sources d'information permet la mise jour l'entrept de donnes. L'intgrateur peut alors combiner ces donnes avec celles provenant d'autres sources ou demander toutes les sources d'information d'apporter des changements l'entrept.

10

Dans cet article, on a propos le concept du la technologie d'entreposage de donnes, y compris un Intranet virtuel pour assurer la confidentialit des donnes des patients travers des structures de soins diffrentes l'chelle rgionale. L'application de cet Intranet virtuel, dans la rgion de Bourgogne, est en cours au niveau du rseau prinatal rgional. Certaines structures de soins de sant, tels que le centre hospitalier universitaire de Dijon on dj implment leur Intranet. Cet article [11] vise dcrire les processus d'entreposage de donnes pour l'industrie pharmaceutique et les industries des soins de sant. Dans la socit de l'information postindustrielle actuelle, les donnes sont une des ressources les plus prcieuses. Toutefois, les donnes ne sont pas utiles moins qu'il puisse tre trait et transform en information qui permet aux entreprises un avantage concurrentiel.

11

3. MODELISATION CONCEPTUELLE

Durant ce chapitre nous allons dfinir les besoins qui ont engendr la proposition de cette solution, suivie dune prsentation de la conception en utilisant le langage de modlisation UML.

3.1.

SPECIFICATION DES BESOINS

Lapplication du Business Intelligence dans le domaine de la mdecine est dans le but de supporter les besoins des hpitaux pour rassembler linformation de qualit des systmes oprationnels vers un seul entrept de donnes et fournir une vue globale de linformation clinique comprhensible par tous les niveaux de directions et des personnels. En fait, les fournisseurs de soins de sant exigent de grandes quantits dinformations pour leurs oprations financires et leur efficacit clinique. En outre, il y a un besoin de prendre des dcisions complexes. La paralysie faciale (PF) est un domaine mdical ou les ED ont un rle important jouer. Il s'agit d'un dficit moteur complet ou partiel des muscles peauciers d'une moiti de la face, dont l'origine est une atteinte du nerf facial, par opposition aux paralysies d'origine centrale o la lsion responsable est au niveau crbral (accident vasculaire crbral, tumeur crbrale, etc.) La paralysie de Bell est un type spcifique de la PF, cest la paralysie des muscles facials caus par des perturbations qui affectent le nerf facial due la lsion du neurone moteur, celle-ci est lorigine de souffrance physique et ayant un impact psychologique et motionnel sur le patient. Nanmoins, le traitement de cette maladie nest pas encore bien dfinit mois des techniques kinsithrapeutes, tels que les exercices facials, biofeedback, laser, lectrothrapie, massage, thermothrapie, qui sont utiliss pour acclrer le recouvrement. Le principal inconvnient des techniques utilises est l'absence d'une modlisation claire et concise des donnes manipules, rsultant de traitements effectus sur diffrents patients par une srie de mdecins dans diffrents institutions de soins de sant. Cela rend l'change et l'exploitation grande chelle de donnes difficile et complexe. Diverses techniques ont t proposes pour aider les mdecins dans le traitement et la

comprhension de la maladie. Par exemple, dans le travail [12] lobjectif de lauteur est de superviser

12

lvolution des tats patients conduisant la rcupration par la modlisation de flux de donnes trajectoires du nerf facial qui est une tape essentielle menant accomplir le but vis. En outre, la visualisation des trajectoires des flux du nerf facial peut aider les mdecins comprendre en profondeur la maladie travers des comparaisons effectues sur les tats du patient dans le temps, ou entre les tats de diffrents patients. Nanmoins, le problme de lhtrognit de la structure des donnes dune institution lautre persiste encore, do le besoin de collecter les informations relatifs dans une ressource de donnes intgre et concise pour unifier la prsentation et faciliter linterrogation des donnes par les mdecins, les chercheurs et les preneurs de dcisions, et ce dans le but dassurer une surveillance de la rcupration et la comprhension de la maladie PF. Do lobjectif de la solution que nous proposons, la conception et limplmentation dun systme daide la dcision mdicale pour la prise en charge de la PF, constitu de 3 parties : la modlisation des interactions du systme avec les diffrents acteurs, la conception dun exemple de base de donnes source provenant du systme oprationnel clinique, par la suite la modlisation du schma de lentrept de donnes composant le systme dcisionnel.

3.2.

PRESENTATION DU LANGAGE DE MODELISATION

UML (Unified Modeling Language) est un standard dfini par l'OMG (Object Management Group) comme tant une notation ou un langage de modlisation graphique orient objet permettant de modliser un problme de faon standard. Ce langage est n de la fusion de plusieurs mthodes existant auparavant, et est devenu dsormais la rfrence en termes de modlisation objet. Le modle UML est compos de 13 types de diagrammes. Diagrammes de cas d'utilisation : donnent un regard extrieur d'un systme. Chaque

diagramme a des acteurs, des cas d'utilisation, et de la communication. Diagrammes de classe : est un schma qui permet de prsenter les classes et les interfaces des systmes ainsi que les diffrentes relations entre celles-ci, en fait, il permet de dfinir quelles seront les composantes du systme final. Une classe est un ensemble de fonctions (Oprations) et de donnes (attributs).

13

3.3.

DESCRIPTION DU LOGICIEL DE MODELISATION RATIONAL ROSE

Rational Rose est un logiciel dit par l'entreprise Rational (rachete par IBM) pour crer et diter les diffrents diagrammes d'un modle UML (Unified Modeling Language) d'un logiciel. Il permet galement de sauvegarder et d'imprimer ces diagrammes, ainsi que de gnrer le code source Java ou C++ qui leur correspondent.

3.4.

CAS DUTILISATION PRINCIPAL DUN SYSTEME OPERATIONNEL ET DECISIONNEL MEDICAL

Les diagrammes de cas dutilisation suivants vont prsenter une visualisation des diffrentes fonctionnalits pouvant tre prsentes dans un systme logiciel mdical par chaque acteur. Par la suite nous allons analyser les cas dutilisations un par un.

3.4.1.

ACTEUR MEDECIN

Les interactions de lacteur mdecin avec le systme sont prsentes par le diagramme de cas dutilisations prsent ci-dessous :

Consulter traitements effectus sur l es patients


<<include>>

<<include>>

Consulter dossi ers patients


<<include>>

Consulter i nformations

<<include>>

Consulter resultats tests et examens


<<include>>

Medecin

Authentification
<<include>>

Saisi r di agnostique de la gravi t de PF

Saisi r prescri pti on du traitement

FIGURE 1 : CAS DUTILISATIONS DE LACTEUR MEDECIN

14

Authentification : Un mdecin ou nimporte quel utilisateur metier tentant dacceder aux donnes doit sauthentifier avec un nom dutilisateur et un mot de passe avant de se connecter la base de donnes. Consulter information : Pour commencer lexamination dun patient, lacteur mdecin impliqu dans le traitement du patient atteint de la PF consulte les informations disponibles dans la base de donnes du systme dinformations ou le systme dannotations comme tant un pr condition de la prise en charge du cas du patient. La consultation des informations inclus 3 autres cas dutilisations suivant le type de linformation consulte : Consulter traitements effectus sur diffrents patients : accder au systme dannotations et chercher des cas similaires celui en cours de traitement, pour avoir une ide sur le type du traitement ncessaire au patient. Consulter dossiers patients : accder la base de donnes du systme pour avoir une ide sur les informations concernant le patient ge, historique mdical aidant le mdecin effectuer sa tache. Consulter les rsultats des tests et des examens: accder la BD et voir les rsultats de diffrents tests et examens prescrits par le mdecin lui-mme ou par un autre mdecin. Saisir diagnostique de la gravit de PF: Le mdecin diagnostique daprs les informations du patient et du systme dannotations, les tests raliss et lexamination du patient puis prcise la gravit de la PF, il saisit par la suite les rsultats dans le systme dinformations dans lhistorique du patient et fait le transfert dune copie au systme dannotations pour aider dans le futur diagnostiquer la maladie dans les prochaines consultations dautres patients. Saisir prescription du traitement : Aprs avoir diagnostiqu la PF, le mdecin prescrit un traitement pour le patient, aprs avoir cherch dans lhistorique mdical du patient en identifiant les faits qui pourraient interfrer avec le traitement (diabte).

15

3.4.2.

ACTEUR INFIRMIER

Les interactions de lacteur infirmier avec le systme sont prsentes par le schma de cas dutilisations prsent ci-dessous :

T est ORL

T est neurol ogique

Examen ophtalmol ogique

Saisi r prescri ption de tests et examens


<<include>>

T est l ectromyographique

<<include>> <<include>>

Saisi r nouveau dossi er pati ent

Authentification Infirmier Grer dossiers pati ents

<<include>>

Modifier dossi er pati ent


<<include>>

Supprimer dossi er patient

FIGURE 2 : CAS DUTILISATION DE LACTEUR INFIRMIER

Saisir prescription de tests et examens : linfirmier saisit les tests et les examens demands par le mdecin pour un patient dans le systme dinformations, pour que les techniciens du laboratoire les effectuent avec vrification de dates disponibles selon disponibilit de matriels et de personnels. Puis imprime la fiche du rendez-vous et la donne au patient incluant toutes les informations ncessaires (type tests, date, technicien labo, etc.). Relation de gnralisation-spcialisation entre ce dernier cas dutilisation et les cas dutilisations : test ORL, test neurologique, test ophtalmologique et test lectromyographique, que sont des types spcifiques de tests hritant du cas dutilisation pre.

16

Grer les dossiers patients : gestion du dossier patient

par lajout dun nouveau dossier, la

modification des donnes ou la suppression dun dossier dj existant.

3.4.3.

ACTEUR TECHNICIEN LABO

Les interactions de lacteur technicien labo avec le systme sont prsentes par le schma de cas dutilisations prsent ci-dessous

<<include>>

Verifier disponibilit materiels

Consulter materiels

<<include>>

Test lectromyographique

Authentification
<<include>>

Technicien labo

Examen ophtalmologique Saisir resultats tests ou/et examens Test neurologique

Test ORL

FIGURE 3 : CAS DUTILISATION DE LACTEUR TECHNICIEN LABO

Vrifier disponibilit matriels : suite la demande dun infirmier faisant partie du staff dun mdecin pour effectuer des tests particuliers un patient, le technicien du laboratoire doit vrifier la disponibilit du matriel ncessaire la ralisation de ces tests pour une date prdfinie par linfirmier. Consulter matriels: vrifier la disponibilit du matriel inclut les cas dutilisation de la consultation de la BD plus prcisment la table Matriels.

17

Saisir rsultats tests et/ou examens: le technicien du laboratoire

doit intgrer les donnes

concernant les rsultats du test dans la bases pour que les acteurs qui en sont intresss (infirmiers, mdecins, chercheurs, etc.) pourront les rcuprer. - <<Extend>> : la saisie des rsultats stend aux diffrents types dexamens/tests (ORL, neurologique, etc.)

3.4.4.

ACTEUR EQUIPE DE RECHERCHE

Les interactions de lacteur quipe de recherche avec le systme sont prsentes par le schma de cas dutilisations prsent ci-dessous

Lancer des requetes OLAP


<<include>>

<<include>>

Equi pe de recherche

Authentification
<<include>>

Reporting

Data mi ning

Medecin Preneur de decisi on Anal yste

FIGURE 4 : CAS DUTILISATION DE LACTEUR EQUIPE DE RECHERCHE

Lquipe de recherche est une gnralisation de diffrentes parties intresses de linformation rcupre du systme dcisionnel tel que les mdecins, les analystes, les chercheurs et les preneurs de dcisions. Le cas dutilisation recherche stend dautres cas dutilisations :

18

- Lancer des requtes OLAP : Lquipe de recherche a besoin de collecter des informations partir de plusieurs sources dans le but dexploiter leur synthse mais le problme est que les donnes disponibles dans les BD sources sont autonomes et htrognes. La solution est donc dutiliser un schma fdrateur, avec ou sans donnes, que les utilisateurs manipulent comme sil sagissait dune base de donnes habituelle avec donnes courantes provenant dune seule source (vues matrialises) ou de plusieurs sources autonomes et ventuellement htrognes (base de donnes intgre) ou plutt entrept de donnes constituant la cellule de base dun systme dcisionnel. Par la suite, des requtes OLAP (Online Analytic Processing) seront disponibles pour interroger les donnes et avoir une vue globale de linformation existante dans la BD avec des agrgations selon plusieurs critres et sur plusieurs dimensions.

Reporting: gnration automatique de rapports utiles au travail de recherche en fournissant un

environnement de conception visuelle pour crer des dfinitions du rapport. Loutil de Reporting permet aux chercheurs de slectionner des donnes relatives telle priode, tel patient, tel traitement dune maladie, etc., de trier, regrouper ou rpartir ces donnes selon les critres de leur choix, de raliser divers calculs (totaux, moyennes, carts, comparatif d'une priode l'autre, ...) et de prsenter les rsultats dune manire synthtique ou dtaille, le plus souvent graphique selon leurs besoins ou les attentes des dirigeants de lentreprise.

- Data mining: extraction de connaissances partir de grandes masses de donnes (Fouille de donnes) dans des buts danalyses et de prises de dcision. Son utilisation permet par exemple d'tablir des corrlations entre ces donnes et de dfinir des traitements-type de maladies et dextraire des connaissances originales auparavant inconnues. Il s'agit de "fouilles" visant dcouvrir "de l'information cache" que les donnes renferment et que l'on dcouvre la recherche d'associations, de tendances, de relations ou de rgularits.

19

3.5.

CONCEPTION DE LA BASE DE DONNEES SOURCE

Pour commencer, on va prsenter une conception gnrale de larchitecture de la base de donnes du systme oprationnel pouvant tre disponible dans une institution fournissant des services de soins de sant, spcialise au traitement de la paralysie faciale, laide des diagrammes de classes (figure 5). Par la suite, nous allons mettre laccent sur la description des classes (nerf facial) que vont tre modlises dans lentrept de donnes. La paralysie de Bell rsulte d'une inflammation d'origine virale du nerf facial priphrique. Pour pouvoir traiter diffrents cas de patients attaqus de la PF, les mdecins ont besoin danalyser des donnes diverses telles que celles relatives au nerf facial affect. Do lintrt de modliser ce dernier de faon dtaille. Au fait, la modlisation du nerf facial ncessite auparavant la comprhension de lanatomie de ce dernier. Voici une explication brve du fonctionnement diffrents composants du nerf facial. Un nerf facial peut tre divis en deux types de composants principaux : Les composants moteurs Les composants sensoriels

Les composants moteurs essentiels sont : Le moteur branchial : qui fournit les muscles dexpression du visage Le moteur viscral : qui vhicule les innervations parasympathiques toutes les glandes de la tte. Les composants sensoriels sont localiss dans loreille, la membrane tympanique et les deux tiers antrieurs de la langue. Le moteur branchial dtaill est compos de : La portion du nerf facial Les muscles du visage

Les muscles du visage sont diviss en 3 classes : Muscles postrieurs

- Muscles de la moiti suprieure

20

Muscles de la moiti infrieure

Les points de terminaison des ramifications du nerf facial innervent les muscles du visage, pour chaque ramification il y a un point dintersection pour acqurir une nouvelle portion. Chaque portion est identifie par un point de dbut et un point de fin. Pour suivre les tats des patients, llectromyographie est utilise pour dtecter lactivit lectrique du muscle pour lamplifier et la rendre audible et affichable sur un moniteur. On dit que le muscle rpond normalement lexcitation provoque par les lectrodes, si le score qui est calcul en fonction de lamplitude et lintensit est suprieur un seuil pralablement dfinit, sinon, on dit que le muscle ne rpond pas normalement. Le flux du nerf facial est considr comme un objet en mouvement qui circule dans un rseau dfinit. Pour effectuer le test lectrique, on doit mesurer lamplitude et la frquence du flux du nerf facial applique chaque portion du nerf, on doit mesurer aussi lintensit du flux du nerf passant par une portion spcifique. Si lintensit est > 0 donc le flux du nerf passe par une portion. Ce test peut tre effectu priodiquement pour valuer l'volution des tats des patients travers une comparaison mthodique effectue sur les tats du patient dans le temps, ou entre les tats de diffrents patients pour peut aider les mdecins comprendre en profondeur la maladie.

21

FIGURE 5 : DIAGRAMME DE CLASSES GENERAL

22

3.6.

CONCEPTION DE LENTREPOT DE DONNEES DU SYSTEME DECISIONNEL

3.6.1.

PRESENTATION DUN SYSTEME DECISIONNEL

Un systme dcisionnel comme son nom lindique, aide le staff responsable de la prise de dcision (analystes, chercheurs, mdecins et dirigeants) effectuer son travail. La prise de dcision est une tache relativement complexe, qui ncessite une recherche dans les donnes disponibles dans les BD du systme oprationnel. En revanche, celui-ci stocke les donnes dans des structures htrognes, distribues et volatiles (non historises), ce qui fait que ces donnes ne sont pas ou peu adapts lanalyse qui demande le lancement de requtes lourdes pouvant bloquer le systme transactionnel. Contrairement, aux systmes oprationnels ou de production les systmes dcisionnels ont besoins de donnes : Orient mtier : les informations sont organises par fonction dans l'entreprise En lecture seule : on ne supprime JAMAIS des donnes puisque sa raison d'exister est de conserver tout changement. Organis en axes : les donnes sont organises en axes (dimensions) suivant lesquels nous allons analyser un phnomne (fait). Intgres : pour former une vision unique de linformation. Diffrents niveaux de granularit : capable de livrer des informations aussi dtailles que gnrales et ce de la faon la plus transparente possible. Il peut paratre vident de dire que le monde dcisionnel est le contraire du monde oprationnel. On prfre dire que l'un chapote l'autre. Tandis que les systmes oprationnels font rouler l'entreprise, l'informatique dcisionnelle voit rouler l'entreprise et agit en fonction de ce qu'elle voit. L'informatique dcisionnelle est l'ensemble des mthodes, moyens et outils informatiques utiliss pour piloter le processus daide la dcision.

23

3.6.2.

GLOSSAIRE DE LINFORMATIQUE DECISIONNELLE

DSS
Decision Support System, systme d'information dcisionnel, SIAD Systme d'Information d'Aide la Dcision ou EIS Executive Information System. C'est un systme d'interrogation et de prsentation des donnes adapt pour l'aide la dcision. Le terme franais quivalent est informatique dcisionnelle.

BUSINESS INTELLIGENCE On parle aussi de systmes d'aide la dcision et dinformatique dcisionnelle. Dsigne les moyens, les outils et les mthodes qui permettent de collecter, consolider, modliser et restituer les donnes, en vue d'offrir une aide la dcision et davoir une vue densemble de lactivit traite, et ce, travers les mois ou les annes. Il permet de gnrer de la connaissance partir des donnes, et donc, d'aider faire des dcisions stratgiques. L'intelligence d'affaires se base sur un concept cl qui est l'entrept de donnes ou le Data Warehouse.

ENTREPOT DE DONNEES L'entrept de donnes est l'lment central de l'informatique dcisionnelle. C'est une architecture de donnes (comme une base de donnes relationnelle classique) qui permet de reprsenter et de rendre disponible un gros volume de donnes histories, nettoyes, valides, compltes et cohrentes, organises, de faon avoir une structure comprhensible et exploitable par des non informaticiens pour des fins de recherche et danalyse. Avant d'arriver dans la forme souhaite dans l'entrept, les donnes des systmes oprationnels doivent passer par une tape fondamentale intgration de donnes ou Data Intgration.

24

DATA INTEGRATION Processus consistant combiner les donnes rsidant dans diffrentes sources et en fournissant aux utilisateurs une vue unifie de ces donnes. Sert transposer le modle entit-relation des bases de donnes de production ainsi que les autres modles utiliss, en modle base de dimensions et de faits laide doutils ETL.

E .T.L Extraction, Transformation, Loading, il s'agit d'une technologie informatique qui prend en charge lextraction de donnes partir de diffrentes sources (BD, XML, CSV, etc.), de les transformer lgrement (format, dnomination), et de les charger dans une nouvelle base, qui sera ici le data warehouse.

OLAP Online Analytical Processing ou traitement analytique en ligne, est un type d'application informatique orient vers l'analyse sur-le-champ d'informations des bases de donnes multidimensionnelles (entrept de donnes), permettant de collecter, stocker, traiter et restituer ces donnes selon plusieurs axes, dans le but d'obtenir des rapports de synthse.

HYPERCUBE OLAP Ou cube OLAP, est une reprsentation abstraite d'informations multidimensionnelles caractrise par la capacit manipuler les donnes agrges selon diffrentes dimensions. Chaque cellule est dfinie par un seul membre de chaque dimension. Cette structure est prvue des fins d'analyses de donnes.

DIMENSION Un ensemble de donnes du mme type, permettant de structurer la base multidimensionnelle. Une dimension est laxe selon lequel on veut faire l'analyse.

25

FAIT Le fait, en complment aux dimensions, cest sur quoi va porter l'analyse. Ce sont des tables qui contiennent des informations oprationnelles. Un fait est tout ce qu'on voudra analyser.

BD MULTIDIMENSIONNELLE Structure de donnes ayant au moins trois dimensions indpendantes, les donns sont agrges suivant les dimensions.

DATA MART Ou magasin de donnes est un sous-ensemble du data warehouse, il est gnralement exploit pour restituer des informations cibles sur un mtier spcifique.

MESURE Le plus souvent de type entier ou dcimal, cest un lment de donne sur lequel portent les analyses, en fonction des diffrentes dimensions.

CELLULE Une donne du cube dfinie par une position de chaque dimension.

HIERARCHIE Une hirarchie est un ensemble de membres organiss en une structure pour l'analyse pratique. Cette organisation de donnes est comparable un arbre logique, ou chaque membre n'a pas plus d'un pre mais un nombre quelconque d'enfants.

26

MEMBRE Un membre est un point dans une dimension dtermine par un ensemble particulier de valeurs d'attribut.

NIVEAU HIERARCHIQUE Au sein d'une hirarchie, les positions sont en gnral organises en niveaux. Un niveau est une collection de membres qui ont la mme distance de la racine de la hirarchie.

REPORTING Un environnement de conception visuelle pour crer des dfinitions et gnrer automatiquement des rapports, on peut aussi prsenter les rsultats dune manire synthtique ou dtaille, le plus souvent graphique selon les besoins.

DATA MINING Fouille de donnes extraction de connaissances partir de grandes quantits de donnes par des mthodes automatiques. L'utilisation industrielle ou oprationnelle de ce savoir dans le monde professionnel permet de rsoudre des problmatiques trs diverses.

27

3.6.3.

SCHEMA EN ETOILE

Un schma de donnes en toile est un arrangement de tables dans une base de donnes relationnelle. Au centre, on trouve la table de faits, dont les colonnes constituent les mesures permettant de raliser les analyses, et les cls trangres vers les tables de dimensions. Les branches de l'toile qui rayonnent partir de la table de fait correspondent aux dimensions. Une dimension englobe un ensemble de descripteurs. Le modle conceptuel de donnes permet de retrouver cette forme en toile. Dans notre cas, le fait central est prsent par la table test lectrique et des dimensions nerf facial, flux nerf facial, temps, patient, mdecin et institution. Le but est danalyser les informations suivantes : amplitude, intensit, frquence suivant les axes que sont les dimensions.

FIGURE 6 : SCHEMA EN ETOILE DE LENTREPOT DE DONNEES

28

3.6.4.

SCHEMA EN FLOCON DE NEIGE

Ou snowflake schema, est une variante du schma en toile plus adapt pour des usages bien spcifiques. Dans la thorie, la diffrence rside dans la simple normalisation des tables de dimensions. Il est donc tout simplement question de mettre les attributs de chaque niveau hirarchique dans une table de dimension part. Ci-dessous (figure 7), le mme exemple prcdent de la modlisation de notre entrept de donnes portant sur lanalyse des donnes des patients atteints de la paralysie faciale, mais avec lajout de niveaux hirarchiques quelques dimensions pour plus de souplesse aux utilisateurs lors de la gnration de requtes OLAP et approfondir par la suite lanalyse. Les hirarchies cres sont pour : La dimension temps: Temps jour semaine mois semestre anne

La dimension institution: Institution ville rgion pays

La dimension nerf facial Nerf_facial portion_nerf_facial

29

FIGURE 7 : SCHEMA EN FLOCON DE NEIGE DE LENTREPOT DE DONNEES

30

3.6.5.

SCHEMA EN CONSTELLATION

Dans un schma en constellation, plusieurs modles dimensionnels se partagent les mmes dimensions, c'est--dire, les tables de faits ont des tables de dimensions en commun. Donc un modle en constellation comprend ainsi plusieurs faits et des dimensions communes ou non ces faits. Nous avons proposes deux exemples de modles en constellation possibles pour notre cas dtude. Pour le premier (figure 8), les deux faits sont le test_lectrique et le test_clinique qui ont 4 dimensions en commun : patient, mdecin, institution et temps.

FIGURE 8 : SCHEMA EN CONSTELLATION DE LENTREPOT DE DONNEES 1

31

Pour le deuxime, les deux tables de faits sont test_electrique et test_lectromyographique dont les dimensions en communs sont : temps, patient, mdecin, institution, flux_nerf_facial, nerf_facial.

FIGURE 9 : SCHEMA EN CONSTELLATION DE LENTREPOT DE DONNEES 2

Pour conclure, les diffrences entre ces trois modles sont faibles et ne peuvent donner lieu des comparaisons de performance. Ce sont des schmas issus de la modlisation dimensionnelle utiliss par les outils dcisionnels.

32

4. IMPLEMENTATION ET EXPERIMENTATION

Dans ce chapitre, nous commenons par dcrire le choix de lenvironnement de dveloppement de notre application. Ensuite, nous dcrivons le systme obtenu via des captures cran.

4.1.

DESCRIPTION DE LENVIRONNEMENT DE DEVELOPPEMENT

4.1.1.

MYSQL SERVER 5.1

MySQL 5.1 est la dernire version de la base de donnes open source la plus populaire du monde. Le logiciel MySQL offre un trs rapide, multithread, multiutilisateur et robuste serveur base de

donnes SQL (Structured Query Language).

4.1.2.

PENTAHO BI

Une plate-forme de Business Intelligence complte qui comprend les fonctionnalits Reporting, analyse de donnes (OLAP), tableaux de bord, data mining et intgration de donnes (ETL). Peut tre utilis comme une suite complte ou en tant que composants individuels qui sont accessibles via des services Web. Class n 1 en open source BI.

33

4.1.3.

PENTAHO DATA INTEGRATION

Anciennement Kettle, est un ETL complet de la suite dcisionnelle Open Source Pentaho, pouvant tre utilis indpendamment de cette dernire. Ce produit fournit une interface graphique pour la manipulation des donnes et cela contrairement la plupart des autres produits non commerciaux. Il est le fruit du travail de Matt Casters, un consultant BI qui l'a dvelopp l'origine pour ses propres besoins au dbut des annes 2000.

4.1.4.

PENTAHO SCHEMA WORKBENCH

Le Mondrian Schema Workbench est une interface de conception qui permet de crer et tester des schmas cubes OLAP Mondrian visuellement.

4.1.5.

JASPERSOFT IREPORT

JasperReports est outil de Business Intelligence Open Source de gnration de rapports dvelopp en Java, pour des applications Java.

34

4.2.

REALISATION

Au cours de cette section, nous allons aborder la ralisation de la solution. On va traiter la mise en uvre de la conception et de ltude architecturale prcdemment tablie, et ce en invoquant la description du travail accompli travers des imprimes crans du dveloppement des fonctionnalits BI traits au cours de ce projet que sont la construction de lentrept de donnes, la gnration des cubes OLAP et le Reporting.

4.2.1.

CONSTRUCTION DE LENTREPOT DE DONNEES

Pour la construction de lentrept de donnes, nous allons alimenter les tables de dimension et de fait pouvant avoir diffrentes sources de donnes (ici on choisi lexemple fichier texte). Des outils logiciels sont alors ncessaires pour intgrer les donnes dans le data warehouse. En fait, On parle d'ELT (Extract, Transform, Load). Dans ce projet, nous avons choisi de travailler avec la suite open source de Pentaho Business Intelligence dont Pentaho Data Integration est loutil ETL. Les phases de l'alimentation d'un data warehouse sont les suivantes :

Extraction des donnes : Il s'agit de collecter les donnes utiles lanalyse des systmes de production. Dans notre cas, on va extraire les donnes des fichiers textes contenants les donnes sources.

Transformation des donnes : Il faut rendre les donnes cohrentes avec la structure du data warehouse. On d'applique alors des filtres sur les donnes. Par exemple, il peut tre ncessaire de convertir le format des donnes de string en dates (jj/mm/aaaa). Il faut galement associer les champs source avec les champs cibles.

Chargement des donnes : C'est la dernire phase de l'alimentation d'un data warehouse. Il s'agit d'insrer les donnes au sein des tables du data warehouse.

35

FIGURE 10 : SCHEMA DE LARCHITECTURE GENERALE DU DATA WAREHOUSE [13]

Larchitecture de lED pralablement dfinie lors de la phase de la conception est constitu de tables de dimensions et une table de fait ou 2, selon le schma de modlisation choisi pour implmenter le data warehouse. Dans cet exemple, on a choisi le schma en toile puis quil est plus simple implmenter et grer. Donc on a larchitecture suivante du DW : 5 tables de dimensions : mdecin, patient, institution, nerf facial et temps. 1 table de faits : test lectrique.

La cration dune table de dimension avec loutil PDI est beaucoup plus simple quune table de fait. En fait, on doit juste extraire les donnes disponibles dans le fichier texte et les charger dans la table dimension. Grce linterface graphique de loutil SPOON de PDI, on peut crer des transformations, les excuter et les sauvegarder. Les composants permettant la manipulation des donnes dans le schma de la transformation sont nomms tapes . Entre deux tapes conscutives il faut avoir un lien pour indiquer vers quelle tape est dirig le flux (matrialis par le sens de la flche). Dans notre cas, la cration de la dimension, on a besoin de deux tapes :

Extraction depuis fichier

Insertion dans table

36

Lcran suivant donne un aperu de linterface de SPOON. Les diffrentes tapes sont visibles dans la linterface. Le schma de la transformation est dans la partie droite de linterface.

FIGURE 11 : SCHEMA DUNE TRANSFORMATION DANS LINTERFACE SPOON

La premire tape Extraction depuis fichier permet lextraction de donnes depuis un fichier texte, on doit diter linformation de ltape pour pouvoir extraire les donnes du fichier, par exemple lemplacement du fichier, le dlimiteur entre les champs du contenu du fichier, le type et le format de donnes, etc. Par la suite, on doit importer les champs. Une fois imports, on peut prvisualiser les donnes existantes dans le fichier sil ny a aucun problme.

FIGURE 12 : LETAPE EXTRACTION DEPUIS UN FICHIER EMPLACEMENT DU FICHIER SOURCE

37

FIGURE 13 : EXTRACTION DEPUIS UN FICHIER ADAPTER AU CONTENU DU FICHIER

FIGURE 14 : EXTRACTION DEPUIS UN FICHIER RECUPERATION DES CHAMPS

38

FIGURE 15 : EXTRACTION DEPUIS UN FICHIER PREVISUALISATION DE DONNEES

La deuxime tape Insertion dans table permet linsertion des donnes extraites dans une table de base de donnes. On doit prparer en avance une base de donnes dans laquelle la table va tre cre. De nombreux types de SGBD sont supports (une trentaine). Nous avons choisi de travailler avec MySQL SERVER 5.1 qui la dernire dition du produit MySQL comme tant outil connu et simple. Nous avons cr une nouvelle BD avec la possibilit de travailler avec la BD par dfaut Test . Pour personnaliser cette tape, nous devons crer une nouvelle connexion avec la base de donnes MySQL en insrant les informations relatives.

FIGURE 16 : INTERFACE POUR EDITER LETAPE INSERTION DANS TABLE

39

FIGURE 17 : INSERTION DANS TABLE CONFIGURATION DE LA CONNEXION

Par la suite on doit rcuprer les champs de ltape prcdente.

FIGURE 18 : INSERTION DANS TABLE RECUPERATION DES CHAMP

40

Un script SQL est cr lors du clic sur bouton SQL.

FIGURE 19 : INSERTION DANS TABLE: REQUETE SQL

On excute le script SQL, puis la dernire phase, aprs avoir termin la modification de la transformation votre transformation pour lintgration des donnes dans la table, est lexcution de la transformation.

FIGURE 20 : EXECUTION DE LA TRANSFORMATION

On a dans linterface ci-dessus, au bas de limprime cran, les tapes et les rsultats de leurs excution : lignes lues du flux dentre provenant du fichier source, lignes lues de ltape prcdente et

41

crites dans la table, etc. Sil yaura une erreur dans lexcution, ltape contenant le bug apparaitra en rouge. Vous pouvez ainsi choisir de modifier l'tape source de l'erreur. Ainsi, on a construit les tables de dimension que sont disponibles dans la base de donnes MySQL. Maintenant, on passe la cration de la table de fait qui est un peu plus compliqu. Une table de fait doit contenir toutes les cls relatives aux tables de dimensions, ainsi on aura la forme en toile qua le schma de conception de lentrept, en plus des mesures, les donnes susceptibles dtre analyses en fonction de diverses valeurs de chaque dimension. Le processus de lalimentation de la table de fait est visible dans lcran suivant :

FIGURE 21: ETAPES POUR ALIMENTATION DE LA TABLE FAIT

Le processus de cration de la table de fait test lectrique est constitu des tapes suivantes : Extraction depuis table : on extrait les donnes de la table test_electrique dj existante dans la BD source et qui ne contient pas les identificateurs des tables de dimensions. En fait, elle contient les identificateurs des tables sources dont on a extrait les tables dimensions. Les tables dimensions en fait contiennent ces cls aussi.

42

FIGURE 22: EXTRACTION DEPUIS TABLE

Recherche dans dimension : ayant dj les cls des tables sources de dimensions extraites de la table test_electrique on cherche dans chaque table dimension la cl correspondante celle de la table test_electrique , trouve on retourne lidentificateur de la table dimension du mme champ.

FIGURE 23 : RECHERCHE DANS LA BASE DE DONNEES

Aprs avoir recherch les id des diffrentes dimensions en question, on met jour la table de fait et on insre les donnes provenant des diffrentes tapes, et ce en liminant les champs inintressants dans

43

la table de fait. Donc on doit avoir par la fin une table de fait contenant les id des dimensions et les champs mesures de la table test_electrique .

FIGURE 24 : INSERTION/MAJ DANS TABLE

On peut par la suite explorer la base et voir la nouvelle table fait cre, on peut aussi visualiser les lignes et ce laide de lexplorateur de BD.

FIGURE 25 : PREVISUALISATION DE DONNE

44

4.2.2.

ANALYSE DE LENTREPO T DE DONNEES

Lanalyse de donnes aide les exploiter avec le maximum defficacit ce qui permet de gagner de nouvelles ides, mieux comprendre et optimiser lacte de prise de dcision. Dans ce travail, on a pris en charge lanalyse de donnes de lentrept de donnes en utilisant comme outil le Pentaho Schema Workbench. PSW permet de crer des cubes OLAP Mondrian partir d'un modle en toile de l'entrept de donnes. Il offre les fonctionnalits suivantes: - Editeur de schma intgr avec la source de donnes pour la validation. - Test des requtes MDX par rapport au schma et la base de donnes. - Parcourir la structure des bases de donnes. Une fois quon a le fichier XML du schma, on peut le tlcharger dans une application pour en utiliser les donnes. En premier lieu, on doit configurer les proprits connexion la source de donnes qui est dans notre cas la base de donnes MySQL.

FIGURE 26: CONFIGURATION DE LA CONNEXION A LA SOURCE DE DONNEES

45

Comme cest dj dit, loutil PSW permet dexplorer la base et de visualiser sa structure.

FIGURE 27 : EXPLORATEUR DE BASE DE DONNEES

Par la suite, nous venons de crer un nouveau schma, qui permet son tour de crer et diter des cubes et des sous-lments des cubes, tel que les dimensions, les tables de faits, les hirarchies, les niveaux, les mesures, etc. Ci-dessous, un cran de larchitecture du schma de notre entrept de donnes.

46

FIGURE 28 : STRUCTURE DU SCHEMA

Loutil permet aussi la visualisation du schema que vous ditez sous forme de code XML.

FIGURE 29 : EDITEUR CODE XML

47

Loutil PSW permet lexcution de requtes MDX pour tester le schma prdfinit. Les messages d'erreur ou les rsultats sont affichs. Pour notre exemple, nous lanons la requte MDX suivante pour rcuprer les rsultats viss. En fait on a besoin des rsultats en amplitude et en frquence du test lectrique pour tous les patients, les femmes et les homes. SELECT {[Measures]. [Amplitude], [Measures]. [Frequence]} ON COLUMNS, {[Sexe].members} ON ROWS FROM [cubepf] Lcran suivant montre le rsultat :

FIGURE 30 : EXECUTION DE LA REQUETE MDX

48

4.2.3.

REPORTING

Aprs avoir cr notre schma Workbench, on a besoin de produire des documents de types dynamiques pour visualiser nos donnes en diffrents formats, la fonctionnalit Reporting rpond notre besoin. JasperReports est un outil Business Intelligence de Reporting permettant lexportation de donnes de diffrentes sources : schmas, bases de donnes, fichiers Excel, fichiers textes, etc. Il permet aussi la visualisation de donnes dans des rapports et sous diffrentes formes (chartes, tableaux, etc.). En premier lieu, on doit crer la connexion de loutil avec la source de donnes qui est soit un schma Workbench, soit la base de donnes MySQL pour rcuprer les donnes. Lcran suivant montre linterface utilis pour configurer la connexion :

FIGURE 31 : CONNEXION A LA SOURCE DE DONNEES

49

Pour effectuer les rapports dont on a besoin, on a lanc la requte suivante laide du Query Designer : SELECT Dim_patient.`code_patient` AS CODE, Dim_patient.`nom_patient` AS NOM, Dim_patient.`prenom_patient` AS PRENOM, Dim_patient. Sexe` AS SEXE FROM `Dim_patient` dim_patient

Une requte peut tre gnre soit manuellement soit laide du Query Designer. Le Query Designer permet laide de visualiser les donnes disponibles dans la source de donnes et den slectionner les donnes dont on a besoin et la requte est gnre automatiquement.

FIGURE 32 : QUERY DESIGNER

50

Le rsultat de cette requte est un rapport contenant la liste des patients avec les attributs : code, nom, prnom et sexe.

FIGURE 33 : RAPPORT LISTE PATIENTS

51

On lance la requte suivante :

SELECT Count (ft.id_patient) tests, dp.ID_patient patient FROM `Dim_patient` dp, `Fait_te` ft Where dp.ID_patient=ft.id_patient

GROUP BY Patient ORDER BY Patient

52

Cette fois nous allons visualiser les rsultats sous forme de liste de donnes et graphique :

FIGURE 34 : RAPPORT NOMBRE TESTS EFFECTUES PAR PATIENT

53

5. CONCLUSION ET PERSPECTIVES

La paralysie faciale est une maladie attaquant le nerf facial et tant lorigine dune souffrance physique et ayant un impact psychologique et motionnel au patients. Ce travail prsente une conception et une implmentation dun systme daide la dcision mdicale pour la prise en charge des patients ayant la paralysie faciale consistant en la cration, lanalyse et lexploitation des donnes dun entrept pour en tirer de la connaissance et amliorer le processus de prise de dcision sanitaire efficace. Les travaux futurs porteront sur un accs bas Web l'ED qui permet un utilisateur mtier d'accder l'ensemble des ressources dcisionnelles : rapports, analyses multidimensionnelles, tableaux de bords, crer, excuter et publier les rapports facilement en respectant chacun son niveau de scurit. Les travaux futurs consisteront galement en lassurance de la scurit des donnes patients existantes dans lentrept de donnes et pouvant tre consult par diffrents structures de linstitut de soins de sant, vu que ces donnes prsentent une confidentialit du patient.

54

6. LES REFERENCES BIBLIOGRAPHIQUES

BIBLIOGRAPHIE

[1]: Titre:

Lien : http://fr.wikipedia.org/wiki/Entrep%C3%B4t_de_donn%C3%A9es Auteur: Bill Inmon Date de publication: 1994

[2] : Titre: Un entrept de donnes pour laide la dcision sanitaire en nphrologie Lien :

Auteur: Ana Simonet, Michel Simonet, Franck Gaspoz, Mohamed Ben Said, Didier Guillon, Christien Jacquelinet, Claude Mugnier, Jean-Philippe Jais, Paul Landais. Date de publication: 8 /2003

[3]: Titre: Titre: CP-Nexus: A Clinical Data Warehouse at Columbia-Presbyterian Medical Center Lien : http://www.cpmc.columbia.edu/ais/resources/ic/ Auteur: Philip Burrowes, Jason Oliveira, Date de publication : -

[4]: Titre: Atos Origins Data Warehouse solution

Lien : www.atosorigin.com
Auteur: Atos Origin Date de publication : 06/2004

55

[5]: Titre: Convergence CT Clinical Data Warehouse Lien : www.convergencect.com Auteur: Convergence CT Date de publication : 2007

[6]: Titre: Data Warehouse for a Healthcare Provider Lien : www.pluralsoft.com Auteur: Plural Soft Date de publication : -

[7]: Titre: Enterprise Data Warehouse Lien : www.edgewater.com Auteur: Edgewater technology Date de publication : 2007

[8]: Titre: Oracle Healthcare Provider Intelligence Lien : oraclesales_us@oracle.com. Auteur: Oracle Date de publication : Fvrier 2004

[9]: Titre: A Virtual Intranet and Data-warehousing for Healthcare Co-operation Lien :

Auteur: El Mostafa Kerkri, Catherine Quantin, Thierry Grison, Franois Andr Allaert Anne Tchounikine and Kokou Ytongnon Date de publication : 2001

56

[10]: Titre: medical warehousing architecture and its application to epidemiological follow-up Lien :

Auteur: Kerkri E., Qantin C., Ytongnon K. Date de publication: 23-23 mars 1999

[11]: Titre: Data Warehousing in Pharmaceuticals and Healthcare: An Industry Perspective Lien :

Auteur: M. Kumar Sagar, Himanshu Raval Date de publication:

[12]: Titre: Facial Nerve Stream Trajectory Data Modeling and Visualization Lien:

Auteur: Dr. Jalel Akaichi Date de publication : Avril 2011

[13]: Titre: Architecture gnrale Lien : http://xpose.avenir.asso.fr/viewxpose.php?site=39&subpage=/archi.html#alim Auteur: J Detroyes, supinfo Date de publication :

57

NETO-GRAPHIE

http://grim.developpez.com/articles/concepts/bi-intro/#LIII-B

http://fr.wikipedia.org/wiki

http://blog.atolcd.com/wp-content/Pentaho-Diff%C3%A9rences-versions-CE-et-EE.pdf

http://www.opentaps.org/docs/index.php/Tutorial_iReports#MDX_queries_and_Mondrian_OLAP_dat asource

http://www.cnebmn.jussieu.fr/enseignement/biophysiqueneurosensorielle/cours_acoustique/travail_oct obre/messagesnercochleaire.html

http://mondrian.pentaho.com/documentation/schema.php#XML_Measure

http://bernard.lupin.pagesperso-orange.fr/glossair.htm#Cellule

http://blog.developpez.com/businessintelligence/c1315/entrepots-de-donnees-datawarehouses/

http://www.atolcd.com/fileadmin/Publications/Atol_CD_Livre_Blanc_ETL_Open_Source_01.pdf

http://grim.developpez.com/cours/businessintelligence/concepts/conception-datawarehouse/

http://xpose.avenir.asso.fr/viewxpose.php?site=39&subpage=/archi.html

http://www.grappa.univ-lille3.fr/polys/fouille/sortie003.html

http://www.slideshare.net/dataminingtools/introduction-to-pentaho-analysis-2977583

58

RESUME

La Paralysie Faciale (PF) est une maladie affectant le nerf facial qui, malgr les techniques qui sont utiliss pour acclrer le recouvrement, un traitement efficace nest pas encore bien dfinit. Afin damliorer la connaissance mdicale de cette maladie, mdecins, chercheurs cliniques et administrateurs ont besoins de l'information dans des objectifs de prise de dcision sanitaire. Vu les diffrentes sources de donnes cliniques, une programmation extensive est exige pour extraire et intgrer l'information chaque fois que celle-ci est demande. Ceci engendre un retard de livraison de l'information ceux qui en ont besoin. Fournir des moyens pour accder la donne prcise et instantane est un grand dfi supportant la prise de dcision efficace, la recherche et l'amlioration des processus. Notre solution propose consiste crer une source de donnes intgre pour faciliter l'analyse des donnes relatives aux patients affects de la PF.

ABSTRACT

Facial paralysis (FP) is a disease affecting the facial nerve which, despite techniques that are used to accelerate recovery, effective treatment is not yet well defined. To improve the medical

knowledge of the disease, doctors, clinical researchers and administrators need the information in the objectives of health decision making. Given the different sources of clinical data, an extensive program is required to extract and integrate information whenever it is requested. This causes a delay in delivering information to those who need it. Provide means to access specific and instantaneous data is a big challenge that supports effective decision making, research and process improvement. Our proposed solution is to create an integrated data source to facilitate analysis on patients affected with FP data.

59

60

61

62

63

64

65

66

Das könnte Ihnen auch gefallen