Beruflich Dokumente
Kultur Dokumente
Pour remplir cette mission, la TGIR Huma-Num est btie sur une
organisation originale consistant mettre en uvre un dispositif
humain (concertation collective) et technologique (services numriques
prennes) lchelle nationale et europenne en sappuyant sur un
important rseau de partenaires et doprateurs.
En savoir plus
TGIR Huma-Num
Ple communication
190, avenue de France
75013 PARIS
INFORMER PARTAGER DIFFUSER
huma-num.fr
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 3
SOMMAIRE
Marc Renneville,
Directeur de recherche CNRS,
directeur.
Stphane Pouyllau
Ingnieur de recherche CNRS,
directeur-adj.technique .
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 5
Juillet 2015
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 7
II - Organisation de linfrastructure
Statut de la structure : UMS 3598 (tutelles CNRS-Aix-Marseille Universit-EPCS
Condorcet) suite la fusion de lUPS 2916 (ADONIS) et de lUMS 3534 (CORPUS) au
01/03/2013.
Administration et Communication /
gestion nancire Formation
Ariane Allet (IE, CNRS), resp. Nadine Dardenne (IE, CNRS), resp.
Alain Belvindrah (T, CNRS) Latitia Najar (IE, cdd)
Sophie David (CR, CNRS), resp. Jol Marchand (IR, CNRS), resp.
Nicolas Larrousse (IR, CNRS), resp.
Anne Joly (IR, cdd) Grald Foliot (IR, CNRS)
Shadia Kilouchi (IE, CNRS)
Nicolas Larrousse (IR, CNRS) Pierre-Yves Jallud (IE, CNRS)
Jean-Luc Minel (PU)
Jean-Luc Minel (PU) Nicolas Larrousse (IR, CNRS)
La TGIR Huma-Num est dote dun comit de pilotage et dun conseil scientifique.
Comit de pilotage
Missions :
approuver les programmes scientifiques ;
valider la proposition de budget annuel dans le cadre dune programmation
pluriannuelle et de son excution ;
mettre en place un conseil scientifique et un comit des utilisateurs ;
mettre en place les instances dvaluation requises ;
approuver les projets de collaboration ;
prparer lvolution et leuropanisation de la TGIR Huma-Num
Conseil scientifique
Le conseil scientifique donne son avis sur toute question scientifique et tech-
nologique concernant les activits de la TGIR Huma-Num.
BILAN INTERMDIAIRE DE LA TGIR HUMA-NUM / 2013 - 2015 9
Le conseil scientifique est prsid par Olivier Baude. Franoise Genova en est la
vice-prsidente.
La direction de la TGIR Huma-Num participe aux runions du conseil scientifique.
Alexandre Gefen, reprsentant du conseil scientifique de lINSHS est invit perma-
nent de ce conseil.
4. Concertation collective
STOCKER ARCHIVER
Entreposer . Organiser Prservation long terme
TRAITER SIGNALER
Outils . Logiciels Enrichissement smantique
Accs unifi
DONNES
DIFFUSER DE LA RECHERCHE EXPOSER
Machines virtuelles Documenter . Partager
Diffusion web
Diffuser : Il sagit ici dune large palette de solutions pour diffuser les donnes.
Loffre vise couvrir tous les niveaux de besoins, du plus basique au niveau expert.
Elle va de packs logiciels prconfigurs et optimiss pour lcosystme des SHS :
bibliothques numriques, interoprabilit Europeana ; Gallica ; Isidore, etc) jusqu la
fourniture de machines virtuelles prfigures pour les communauts SHS (exemple :
mise en uvre de BaseX pour la diffusion de corpus XML/TEI). Ce service est intero-
prable avec les services dexposition de donnes de la TGIR (NAKALA) et de signale-
ment (ISIDORE).
CINES. Ce service est opr dans le cadre dune convention, renouvele en 2014 pour 4
ans, entre la TGIR Huma-Num, le CINES et le SIAF (Service Interministriel des Archives
de France). Lexpertise de la TGIR Huma-Num est aujourdhui largement reconnue sur
ces aspects darchivage des donnes numriques, au-del mme des SHS. En 2015,
larchivage de plusieurs programmes nationaux est en cours (OpenEdition, IRHT,
Equipex Ortolang) ainsi que larchivage des donnes dEcole Franaise ltranger
(EFEO). Pour rappel, cest laide de ce dispositif que les donnes de larchive ouverte
nationale HAL sont archives.
NAKALA propose deux grands types de services : des services d'accs aux donnes
et des services de prsentation des mtadonnes. Les producteurs de donnes
numriques ainsi soulags de la gestion purement technique, peuvent se consacrer
la valorisation scientifique de leurs donnes. Un identifiant unique est associ
chaque donne et permet ainsi de citer les donnes indpendamment de leur locali-
sation relle : la technologie propose est base sur lattribution didentifiants de
type handle, qui possdent un mcanisme dadressage gnrique, sans lien avec
linstitution qui porte le service. Cest ce qui rend prenne laccs la donne, mme
en cas de changement ou dvolution de linstitution qui porte le service.
NAKALA dispose dun entrept RDF (Resource Description Framework) de type
Triple Store, qui permet de partager les informations en utilisant les principes, mth-
odes et technologies du Web de donnes. Lutilisation de ces technologies standardi-
ses permet de btir des applications de valorisation de ces donnes, par exemple
des cartes interactives. Les donnes peuvent ainsi tre moissonnes par des
services spcialiss, comme ISIDORE, mais aussi Europeana, Gallica, etc., ce qui
permettra den accrotre la visibilit. La complmentarit avec le service ISIDORE est
totale, puisque les deux services partagent les mmes principes.
Cluster #1 :
- Mise en uvre de 8 serveurs achets fin 2013, ralisant un hbergement
modernis de l'ensemble des services et premire srie d'actions pour la bascule de
l'infrastructure de 2009 vers la nouvelle dans le courant de 2014.
- Mise jour des solutions de stockage de donnes (NAS)
- Objectif de migration complte fin 2015
Cluster #2 :
- tude comparative et maquettage des solutions de virtualisation de serveurs :
cosystme VMware, cosystme KVM (virt-manager, Proxmox, oVirt/RHEL), virtu-
alisation lgre (Linux Vserver, OpenVZ, LXC, Docker)
- Choix de l'cosystme KVM plus ouvert et plus utilis au sein de la communaut
Recherche (dont les SHS), et de LXC pour la virtualisation lgre
- Prsentation de cette tude un workshop
- Achat et mise en uvre de 2 serveurs pour dmarrer lavirtualisation de
l'infrastructure
- S1-2015 : passage en production pour une dizaine de machines virtuelles
- S2-2015 :
Virtualisation complte des serveurs
Capacit d'accueil importante dans les 2 modes (virtualisation lourde et lgre)
Mise en production de nouveaux services sur le Cluster #2 :
- Mise en production de services dditorialisation/diffusion des donnes de la
recherche dans lcosystme SHS
- Service de listes de diffusion (logiciel SYMPA) mise en uvre pour nos utilisateurs
- Documentation dtaille et publicit autour des logiciels commerciaux achets par
Huma-Num pour les communauts SHS : en particulier les licences pour les diteurs
de donnes de la recherche.
IV - Dimension internationale
La TGIR Huma-Num porte la participation de la France dans lERIC DARIAH et
participe 3 programmes H2020 accepts dans le cadre de son action pour les
humanits et le patrimoine numriques de la recherche en SHS et arts. Dans ces 3
programmes H2020, la TGIR Huma-Num fournit soit des services ddis et issus des
savoir-faire maitriss par la TGIR, soit de lexpertise sur le domaine des infrastruc-
tures de recherche en SHS. Dans ce cadre, la stratgie de la TGIR est de porter ses
services numriques dans le cadre europen des infrastructures de recherche dans
le respect des modles de dveloppement des infrastructures nationales des pays
de lUnion et dans celui des normes et standards en vigueur dans les donnes des
SHS numriques.
Il sagit dun appel cibl, conu par la CE pour les ERIC nouvellement crs afin
daider leur dmarrage. Le dossier de rponse a t labor lautomne 2014 par
lERIC DARIAH auquel taient associs les trois institutions de pays membres fonda-
teurs de lERIC : la France (avec le CNRS & les partenaires nationaux), lAllemagne
(avec luniversit de Gttingen) et les Pays-Bas (avec le DANS). Le projet est prvu
pour une dure de deux ans et il est organis autour de huit Work-Packages (WP).
La TGIR Huma-Num a coordonn la rponse franaise et a sollicit les contributeurs
DARIAH en 2015 en fonction des diffrents WP affects la France par lERIC. La
France est en charge du WP n4 (Training and Education).
V - Perspectives
On peut apprcier les perspectives de la nouvelle TGIR au regard de lopration de
fusion du TGE Adonis et de lIR Corpus, des caractristiques dHuma-Num et de sa
prospective.
1. valuation de la fusion
2. Caractristiques actuelles
Huma-Num appuie son action sur une forte implication des communauts
scientifiques SHS pour la dfinition, lusage et le suivi de ses services.
Huma-Num est leader en matire de web smantique dans le domaine de la
recherche en SHS, en particulier en matire de mise en uvre des mthodes et
techniques du web smantique (web de donnes) grande chelle (big data).
Huma-Num est lunique partenaire labellis par les Archives de France pour
larchivage long terme des donnes numriques de la recherche (en coopra-
tion avec le CINES).
Huma-Num coordonne la participation de la France dans DARIAH (ERIC).
La TGIR Huma-Num prsente une forte valeur ajoute par rapport aux infrastruc-
tures similaires existantes dans son domaine scientifique par les points suivants :
Dfinition et mise en uvre de services numriques tourns vers les donnes
de la recherche en SHS et adapts aux besoins multiples des communauts
SHS (services spcifiques pousant les pratiques de recherche).
Convention CINES/MCC sur larchivage long terme des donnes numriques
Mise en uvre du web smantique pour les donnes en SHS (publications,
donnes de la recherche). Dans ce domaine la TGIR Huma-Num est reconnue
au niveau mondial pour son expertise en matire de signalement des donnes
de la recherche SHS dans le web smantique (Linked Open Data) avec les
services ISIDORE et NAKALA.
Articulation de ses services au niveau national, europen et international si
applicable
3. Prospective
Consortium Musica
Labellis en 2014
Consortium 3D
Labellis en 2014
Labellis en 2012
Labellis en 2012
Labellis en 2012
Les corpus pris en compte dans ce consortium sont fortement associs une
activit ditoriale, quelle soit seulement numrique ou quelle ait un double support
(sur papier et en ligne). CAHIER se dfinit par rapport lexistence dune uvre
(incluant les documents prparatoires), ou de plusieurs uvres identifies, dont la
cohrence mrite dtre souligne, publie et outille pour donner lieu de nouvelles
recherches.
Labellis en 2011
Labellis en 2011
Ce consortium est cr pour rpondre aux questions spcifiques qui se posent aux
ethnologues devant la singularit de leurs corpus, limportance thorique et patrimo-
niale de leurs travaux, la richesse et la diversit humaine quils reprsentent. Il sagit,
dans un premier temps, dassurer la conservation et la prennisation des donnes
collectes par les ethnologues sur le terrain ainsi que de tous documents pouvant
aider la contextualisation de ces donnes ou une meilleure comprhension de
llaboration des travaux anthropologiques. Dans un deuxime temps, lobjectif du
consortium est de mettre disposition ces matriaux dans le respect de la proprit
intellectuelle et des normes thiques.