Beruflich Dokumente
Kultur Dokumente
by
ditorial
Au-del dun march mondial prometteur- 8.9milliards de dollars prvus en 2014- le Big Data cest
galement une nouvelle apprhension de la socit et de lconomie. La donne est au cur des nou-
veaux processus, apportant une approche fonde sur lobservation du rel.
Ce guide vise dresser le tableau du Big Data aujourdhui, son histoire, quelques projets, les princi-
paux enjeux actuels et quelques personnalits qui se sont dmarques sur le sujet.
Sans se vouloir exhaustif, le guide du Big Data permettra aux non-initis de se familiariser avec la
thmatique et proposera aux spcialistes un recueil de tmoignages, points de vue, chiffres et ana-
lyses qui donnent un clairage sur le Big Data en France et ltranger.
Sophie DAVIAUD
Directrice de publication
+33 (0) 1 58 12 06 88 / sdaviaud@corp-agency.com
- En France/Europe
Le cas franais : offre et demande, une incompatibilit ?
Donnes personnelles et cyber-scurit : enjeux technologiques et rglementaires
Vers une cohsion europenne
Lopen data et la cration de valeur
Focus Big Data et formation : les programmes, les profils, la cration demplois
- Mise en place du Big Data : le rle des mtiers, la place de la DSI
- Les formations
- La cration demploi
PORTRAITS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 15
Axelle LEMAIRE Henri VERDIER Anne LAUVERGEON Gilles BABINET
Pashu DEWAILLY CHRISTENSEN Doug CUTTING
La revolution Hadoop 2
- Naissance de Yarn et rduction de MapReduce
- Une gestion des fichiers amplement amliore
- Petit panorama de quelques modules Hadoop 2
- Sans oublier : scurit, administration et gouvernance
PROJETS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . page 29
Un projet humanitaire : le dveloppement conomique et le Big Data
Un projet culturel : le data journalisme pour les flux migratoires en Europe
Un projet de lutte contre la fraude : la dtection de la contrefaon en ligne
Un projet dans le secteur automobile : lassurance volutive
Un projet dans le secteur des loisirs : les communauts virtuelles
Un projet de recherche et dveloppement dans lindustrie : lenergy-monitoring
Un projet de recherche : lInstitut de Gnomique du CEA
Un projet dans les transports : la scurit arienne
Un projet en climatologie : lvolution climatique au niveau mondial
ACTUATE / A.I.D. / AMAZON WEB SERVICES / BIME ANALYTICS / BITTLE / BLUESTONE / CAPGEMINI /
CENTRALE PARIS Executive Education / CLOUDERA / Club Decision DSI / CSC / DATASTAX / EDIS CONSULTING
/ EKIMETRICS / EXALEAD / GFI INFORMATIQUE / Hewlett-Packard / IBM France / KEYRUS / MICROPOLE
/ Neo Technology / PENTAHO / PIVOTAL / QLIK / SAP France / SAS / SCINETIK / SEMDEE / SENTELIS /
SINEQUA / SPLUNK / SYNCSORT / TABLEAU SOFTWARE / TIBCO JASPERSOFT / TALEND / TERADATA
France / VISEO.
4
CONTEXTE La notion de volume peut sexprimer en
chiffres: aujourdhui on parle de stocker et
La notion de Varit est un peu plus technique:
les donnes pralablement utilises taient
traiter des exaoctets (1018) voire zettaoctets hautement formates, renseignes selon des
BIG DATA: NOUVELLES (1021) alors quil y a peine 10 ans on parlait de critres communs qui eux seuls garantissaient
DFINITIONS ET CONCEPT mgaoctets (106), stocks sur des disquettes. la capacit de comparaison et de traitement de
Linformation est cependant peu intelligible si
APPROFONDI elle nest pas mise en relief: il est estim que
linformation. Ce que le Big Data apporte, cest
90% des donnes rcoltes depuis le dbut de la possibilit de traiter tout type de donnes,
Cest officiel, on lappellera dsormais lhumanit ont t gnres durant les 2 der- dans sa forme originelle, en intgrant les nou-
megadonnes. Le Big Data est un terme si nires annes. Le plus impressionnant rside veaux modes dexpression, de mesure et din-
frquemment utilis que la Commission gn- dans le fait que la cration de donnes est ex- teractions. On peut alors traiter images, sons,
rale de terminologie et de nologie sen est em- ponentielle. Le graphique ci-dessous donne vido, commentaires de blogs, logs
par, rvlant le 22 Aot dernier sa traduction quelques exemples de donnes gnres, leurs
officielle en franais. La dfinition associe est volumes, et leur impact. (source: tude EMC). ces 3V, on ajoute dsormais le V de Valeur et
la suivante: donnes structures ou non dont
celui de Vracit, qui expriment le besoin de
le trs grand volume requiert des outils dana- La notion de Vitesse ncessite lillustration par
lyse adapts. La commission prcise que lon disposer de donnes fiables, pertinentes et si-
lexemple: quand une entreprise traitait ses
trouve galement lexpression donnes mas- donnes, en mgaoctets auparavant, en plu- gnificatives pour donner suffisamment de sens
sives, dailleurs souvent privilgie ces der- sieurs jours parfois, elle peut dsormais rali- et dintrt conomique des analyses menes.
nires annes. ser la mme tude, sur des volumes Big Data,
Leffervescence autour de ce phnomne apparu en quelques heures voire minutes. Limpact La relle ide derrire le terme Big Data, celle
il y quelques annes, gnre une certaine confu- conomique et le gain defficacit sont alors qui justifie quon parle bien dune rvolution
sion de dfinition, si tant est que certains dtrac- vidents. et non pas dune simple amlioration du trai-
teurs y trouvent un argument de lassitude. tement de la donne, cest le fait que ces 3V
Sil est vrai que le mot Big Data semble parfois changent entirement la faon dont on aborde
utilis outrance, noublions pas que le phno-
linformation. La donne est au centre de cette
mne est bien rel. Rappelons ici quelques no-
transformation.
tions, pour les initis et ceux qui le sont moins. Il est estim que 90% Dans un premier temps, ce sont les entreprises
De faon assez communment admise, le Big
et institutions qui en exploitent ces nouvelles
Data est dfini par les 3V, voire les 4 ou 5V. des donnes rcoltes capacits de traitement et analyse de la don-
Cest la faon la plus schmatique et synth-
tique possible pour expliquer ce que renferme ne. En effet, 70% des donnes cres le sont
cette notion. depuis le dbut de par des individus, mais ce sont les entreprises
qui stockent et grent 80% dentre elles.
Les 3V expliquent en quoi le Big Data repr- lhumanit ont t Parler du Big Data implique donc que lon
sente larrive de technologies permettant une aborde les consquences sur lconomie, les
toute nouvelle approche de la donne. Le Big gnres durant les 2 entreprises et organisations qui lutilisent, et la
Data, cest traiter des Volumes de donnes
faon dont il y est mis en place.
consquemment suprieurs ceux traits au- dernires annes Ce que les premiers projets montrent, cest que
paravant, une Vitesse incomparable, le tout
en intgrant une Varit de donnes largement le Big Data dcuple les possibilits danalyse
plus riche. Chacun de ces V mrite quelques dans tous les secteurs et ouvre de nouveaux
prcisions. horizons la prise de dcision.
74
activit, mais 41% dentre elles nont encore
%
engag aucunes dpenses sur la question.
Les pays mergents En cause, la faible prvisibilit du retour co-
LAmrique du Nord est indniablement en nomique de ces investissements (35% des
avance sur le sujet du Big Data. LEurope suit la dcideurs sinterrogent encore sur le retour
tendance, tout comme la plupart des pays d- sur investissement, selon un sondage EMC).
velopps, o le tissu conomique constitu de Rassurons-nous, les entreprises franaises
nombreuses startups et de grands groupes n- ne sont pas les seules. Contrairement lide
cessite et facilite ladoption du Big Data. dune Amrique fortement convaincue et enga-
Les regards se portent donc souvent sur le ge sur le sujet, une tude du cabinet Gartner
gant amricain, alors que des investisse- aux tats-Unis rvle que 56% des entreprises
ments colossaux ont lieu sur le continent ne savent pas comment tirer profit du Big Data.
africain par exemple. Une tude mene par Jusqu prsent, les projets impliquant un trai- DES ENTREPRISES EN FRANCE
MarketsandMarkets indique que les pays mer- tement massif de donnes ntaient mens que SONT CONVAINCUES DE LINTRT
gents sont vous grappiller leur retard dans par quelques leaders du march. Une tude DU BIG DATA
les annes venir et reprsenteront une part publie par DELL en avril2014 affirme cepen-
importante de la croissance du march du Big dant que 41% des entreprises de middle
Data. market - les challengers - ont dsormais Au sein de lopinion publique, le Big Data est
Quelques chiffres rendent compte du potentiel entam un ou plusieurs projets Big Data. dailleurs souvent associ au marketing et la
que reprsentent les pays mergents, ne se- Parmi eux, 89% ont ds prsent identifi des vente, parfois avec une connotation ngative.
rait-ce quau niveau des tlcommunications. retours positifs de leurs projets. Encourageant Lide dun client pi, dissqu et harcel fait
Selon la Banque Mondiale, il existe 6milliards donc. souvent peur. Or un courant nouveau assure
dappareils mobiles sur Terre, dont 5milliards quen tant que consommateur nous ne pour-
se trouvent dans les pays mergents. Les ap- La source de ces interrogations se situe prin- rons pas chapper cette tendance et ferions
plications marketing sont assez videntes, cipalement sur le retour sur investissement. A mieux den savourer les bnfices: une meil-
priori, en matire de technologies, hardware et leure connaissance de nos gots, des promo-
software, les outils se dmocratisent, notam- tions personnalises, des recommandations
ment grce lapparition du Cloud. Cependant, cibles. Tout le monde y trouverait alors son
le Big Data renferme dautres cots, moins me- compte. Reste la question de la protection des
surables et relatifs lapproche culturelle de donnes personnelles, que nous aborderons
Il existe 6milliards lentreprise et son organisation interne. plus tard.
Considrer le Big Data comme un serviteur du
dappareils mobiles sur Si au niveau mondial il faut admettre que le marketing serait cependant extrmement r-
secteur priv reste prudent sur les dpenses ducteur. On connat davantage les projets lis
Terre, dont 5milliards lies au Big Data, on peut sinterroger sur son au marketing et la vente parce que ce sont
ceux qui sont les plus facilement intelligibles
adoption sectorielle. Y a-t-il des domaines
dactivit o le Big Data est plus reconnu, adop- par le grand public et qui laffectent directement.
se trouvent dans les t et accept? De faon assez unanime, les Les plus beaux projets Big Data se trouvent
spcialistes saccordent dire que les acteurs pourtant dans des secteurs que lon observe
pays mergents. du e-commerce et les fonctions marketing ont moins, mais qui nous concernent tout autant.
t les premires se lancer sur le sujet. Par Logistique, maintenance prdictive, recherche,
nature ancres dans linnovation et en lien di- sant, nergie, culture et humanitaire mme.
7
Les domaines dapplications sont vastes. La partie projet de ce guide prsente quelques-uns de ces EN FRANCE / EUROPE
projets dans des domaines varis. Le cas franais: offre et demande,
Conduire plus prudemment grce au laboratoire daccidentologie PSA-Renault, optimiser les une incompatibilit?
consommations nergtiques dun btiment avec Cofely, dtecter une pidmie avec des outils
comme OpenHealth ou encore endiguer la pauvret avec les Nations Unies: le Big Data est bien une
rvolution de la socit dans son intgralit. On parlait plus haut des impressionnants pro-
grammes dinvestissement amricains dans le
Chaque secteur doit donc dvelopper sa propre connaissance du Big Data, son intrt stratgique, Big Data pour ses administrations. Le cas de
financier et les moyens mettre en uvre. la France est bien diffrent, pour linstant du
En termes dimage, la perception selon le domaine dapplication est souvent connote, positivement moins.
ou ngativement. Le plan Big Data pour la Nouvelle France in-
dustrielle, port par Franois Bourdoncle et
laide dune coute mene sur plus de 150K messages, sur la priode du 27/10/2013 au 04/09/2014, Paul Hermelin, et dont la feuille de route a t
avec Focusmatic, nous avons tent de comprendre quels termes et sentiments sont le plus souvent valide en juillet2014, est ce jour la premire
associs au Big Data, et cela par secteur dactivit. Les Tlcoms reprsentent la majorit des relle impulsion conomique manant de ltat
messages connots, quel que soit laspect voqu. En dehors des Tlcoms, la sant, la grande visant dvelopper lcosystme Big Data en
consommation et la publicit sont les secteurs le plus souvent associs des inquitudes et la vie France.
prive. Dans les domaines dactivits des RH et de la grande consommation, le Big Data est encore
un terme et procd peru comme complexe. (% des messages associs , en audience). Une question dapproche et de stratgie se pose
alors, et on remarque, comme cest souvent le
cas, que la dmarche amricaine est bien diff-
rente de celle mene par ltat franais.
Les deux gouvernements sont certes, dsor-
mais, tous deux persuads que le Big Data
est un secteur davenir, multisectoriel, plein
de promesses conomiques, sociales et envi-
ronnementales. Mais les deux gouvernements
nont pas la mme faon de stimuler le secteur.
Outre Atlantique, la prise de position du gouver-
nement Obama passe par le dveloppement de
projets financs par les administrations et d-
di leur propre utilisation. Ce sont ces grands
projets denvergure qui sont censs servir les
objectifs de ltat mais aussi montrer la voie.
La connaissance du Big Data en elle-mme est discutable en France. Qui parle rellement du sujet? Si ltat est rellement persuad de lintrt de
Est-il si rpandu quon le dit? Ou sommes-nous encore aux prmices de ce phnomne? lutilisation du Big Data, pourquoi ne commen-
cerait-il pas par lutiliser lui-mme? Le raison-
Sur la mme priode, nous avons observ le profil des auteurs qui parlent le plus du Big Data. Il nement est pragmatique, mais efficace.
sagit ici danalyser lactivit des auteurs ayant renseign leur profil twitter sur le rseau utilis. On
remarque alors que pour les auteurs se rclamant tre des spcialistes du Big Data, les thma- On ne procde pas exactement pareil en France.
tiques principalement abordes sont dans lordre le Big Data, lopen data, le cloud, la dataviz puis Tout dabord, nous avons pris du retard par rap-
lopensource. Les auteurs spcialistes du cloud ont une activit aussi importante que les sp- port nos voisins amricains. Nous connais-
cialistes du Big Data, bien que moins varie en termes de thmatiques. Fait intressant, ce sont les sons nos forces de trs bonnes comptences
spcialistes de la sant qui ddient proportionnellement le plus de leurs messages lopen data. (% en mathmatiques et statistiques mais nous
des messages associs , en activit. Du 27/10/2013 au 02/09/2014) devons dvelopper nos potentiels. Pour ce faire,
le choix du gouvernement est de construire les
conditions de lpanouissement dune filire
Big Data en France. Le discours, les structures
daccueil, et les enveloppes budgtaires, sont
l pour atteindre cet objectif. Quelques projets
seront galement mens au sein des adminis-
trations, et on ne peut pas ignorer limportant
engagement sur le sujet de lOpen Data, no-
tamment via Etalab. Cependant, il est vident
que lapproche nest pas la mme.
Si la France souffre encore fortement de la
crise conomique et peine dfendre son sta-
tut linternational, elle dispose encore de
grands groupes industriels puissants et agiles.
Cest l que laction du gouvernement sur le
sujet du Big Data trouve un appui non ngli-
geable. Les besoins de financements, les res-
sources humaines, la capacit dinnovation et
les structures de R & D sont disponibles au sein
du CAC40. Le plan de la nouvelle France indus-
trielle, et sa nouvelle feuille de route, puise sa
force exactement dans cet environnement fa-
vorable. Orange, La Poste, GDF Suez, Alstom,
AXA, Socit Gnrale, Cova (le groupe MMA,
GMF et MAAF) Ces grandes entreprises ont
t choisies pour participer aux grands travaux
fraude
du plan initi par Arnaud Montebourg, et d-
objets sormais chapeaut par Franois Bourdoncle et
connects Paul Hermelin.
Objectif affich: contrer limpressionnante su- La question de la rglementation est bien dif- par un numro et interconnectant les fichiers.
prmatie et capacit dinnovation des groupes frente. Laction de la CNIL, les discussions SAFARI, ctait son nom, a alors t vivement
amricains comme Google, Apple, Amazon ou au niveau europen, les disparits au niveau dcri, entrainant la cration dune commis-
Facebook. mondial: les lments de rglementation sont sion informatique et liberts qui proposa la loi
En dfinitive, lapproche franaise est bien dif- complexes, pris en tau entre intrts cono- en 1978. Lopinion publique tait alors sensibi-
frente de lapproche amricaine. Elle prend miques, protection des donnes personnelles lise lutilisation de ses donnes.
cependant en compte ses forces, tente de et scurit de la proprit intellectuelle. Le d-
contrer ses faiblesses, et sautorise de grandes bat mrite plus de dtails. Les donnes marketing que nous voquions
ambitions. Une dynamique positive donc. Reste plus haut sont fortement concernes. Le
savoir quelle sera rellement lenveloppe al- concept de lopt-in est ce jour la principale
loue ces projets via la Bpi notamment Donnes personnelles et cyber-scurit: mesure permettant de contrler linformation
limplication des diverses parties prenantes et enjeux technologiques et rglementaires personnelle que nous divulguons, mais les ou-
le rsultat oprationnel. On parle de dizaines
de millions deuros, vraisemblablement pui- tils numriques sous-entendent un minimum
Le Big Data ne peut dsormais plus tre disso- douverture de linformation.
ss dans les 215millions dbloqus par Fleur ci des problmatiques de scurit. Le terme
Pellerin en 2013. Il semble que suivre les tendances des nou-
est vaste et renferme en ralit plusieurs no-
Reste noter quelques absents non-abords veaux modes de consommation et communi-
tions bien distinctes.
dans cette feuille de route, et pourtant abords cation et parfaitement protger ses donnes
dans la construction du plan Big Data: la for- Il renvoie dans un premier temps, et cest l personnelles soit incompatible. Sen suit une
mation, lvanglisation, et la rglementation. que se situe lessentiel du dbat public, la certaine schizophrnie de la socit, hsitant
Sur le point de vue de la formation, nous en protection des donnes personnelles. Une don- entre un dsir de modernit et la volont de
reparlerons plus loin, mais les initiatives sont ne personnelle telle quelle est dfinie par la prserver son intimit et ses liberts.
nombreuses et les besoins en termes de re- CNIL (Commission Nationale de lInformatique
crutement gnrent plus ou moins naturel- et des Liberts) est toute donne permet-
lement les formations suprieures adaptes. tant didentifier directement ou indirectement
Lenseignement primaire et secondaire reste une personne physique. On parle donc bien
tudier. On enseigne le latin au collge, je ne ici dindividus et non pas dorganismes, entre-
vois pas pourquoi on ny enseignerait pas lin- prises ou associations. Sont exclues les don-
formatique dclarait Fred Potter, CEO et fon- nes utilises dans le cadre dune activit per-
dateur de Netatmo, lors du dernier Hack4france. sonnelle comme un rpertoire tlphonique VOIR LE SITE DE LA CNIL
Sur le plan de lvanglisation, cest--dire le par exemple. Leur utilisation est soumise la
discours de vulgarisation auprs des poten- loi Informatique et Liberts et la directive du
tiels utilisateurs du Big Data en France, on peut 24 octobre 1995 sur la protection des donnes
galement se demander si le march agira par personnelles. Lhistoire de la loi Informatique
lui-mme. Le meilleur moyen de promouvoir le et Liberts remonte bien avant lapparition du
Big Data dans les entreprises est de montrer Big Data. Elle a t depuis adapte de nom-
des cas dapplications concrets, succs et re- breuses reprises, mais lorigine la loi est ne
productibles. Si les quatorze initiatives du plan dun scandale digne de la trs mdiatise af-
Big Data affichent un bilan positif, ltat tiendra faire PRISM. Le gouvernement franais avait
alors les meilleurs ambassadeurs possibles. alors pour projet la cration dun fichier ad-
Le reste suivra, a priori. ministratif national identifiant chaque citoyen
9
Les objets connects seront donc part int-
grante de notre quotidien. L o ils soulvent
Le volume de donnes encore davantage dinquitudes, cest lorsquils
concernent la sant connecte. Bracelets, po-
domtres, balances, tensiomtres, appareils
produites par les sportifs, assistants de confort, aide aux per-
sonnes ges, contrles mdicamenteux Les
internautes doublerait donnes de sant sont considres comme
particulirement sensibles. Elles permettent
tous les 18 24 mois. de caractriser un individu sur des lments
extrmement prcis et privs. Ces donnes
sont traites part dans les actions de la CNIL.
Les acteurs du monde de la sant sont tenus
Les objets connects sont au cur du dbat. de sengager sur lanonymisation totale des
Ils vhiculent invitablement une masse im- donnes sensibles, donnes de sant com-
portante dinformations sur nos modes de vie, prises. La recherche mdicale en est parfois
notre faon de consommer, nos habitudes, pr- pnalise, mais limportance de la scurisa-
frences ou sur notre profil. Daprs les esti- tion de ces donnes est dsormais accepte.
Quelques scandales ont particip cette prise
mations, en 2018, chacun dentre nous pos-
de conscience, notamment lorsque certains
sdera en moyenne 8 objets connects titre
patients ont retrouv leur dossier mdical en
personnel. En 2020, nous en aurons dj 10.
accs libre sur internet aprs un passage
La tendance ne risque pas de sattnuer, tant
lhpital. Comme lexplique Pierre-Yves Lastic,
donn que, selon un sondage publi par Havas
Chief Privacy Officer chez SANOFI, lutilisation
Media France en janvier2014, 60% des inter-
des donnes de sant doit tre particulire-
nautes envisagent la gnralisation des objets ment prcautionneuse. Sassurer que les infor-
connects dici 5 ans, et les peroivent comme mations sont parfaitement anonymises est un
source de progrs (75%) qui facilitent la vie prrequis, quel que soit le pays o se droule
(71%). Le quantified self, en franais le leur traitement et la rglementation en vigueur
soi augment, reprsente lhumain du fu- cet endroit. Un projet de recherche, mme
tur, un futur trs proche. des fins tout fait honorables, ne doit pas justi-
Courant 2014, un ingnieur a fait une trange fier lutilisation de donnes aussi sensibles. Le
dcouverte. Visionnant des publicits qui lui monde de la sant joue avec des informations
paraissaient de plus en plus cibles, il a com- dune haute valeur aux yeux de la socit. Il se
pris que son tlviseur LG espionnait son com- doit de les protger.
portement son insu. Le fabriquant avait activ
par dfaut une fonction de collecte de donnes. Les objets connects cependant ne touchent
Aprs avoir dconnect cette dernire, ling- pas uniquement les donnes personnelles. Le Parlement Europen
nieur a identifi que le tlviseur continuait machine-to-machine par exemple, ou M2M,
transmettre des informations sur ses habitu- vise rcolter un maximum dinformations sur produites par les internautes doublerait tous les
des tlvises et mme ses visionnages de fi- des installations diverses afin doptimiser leur 18 24 mois. Cest une source de valeur souvent
chiers privs. Laffaire a t rvle au grand fonctionnement. Selon lIdate, plus de 80 milliards majeure pour un acteur priv comme public, et
jour et LG a d prsenter publiquement ses de produits seront connects Internet dici galement un point de faiblesse non ngligeable.
excuses tout en sengageant supprimer toute 2020. Laffaire PRISM, rvle par Edward Snowden en
collecte de donnes de ses tlviseurs. La m- Dans lindustrie, des socits comme Airbus ou juin2013 a mis le doigt sur la criticit et la va-
fiance sest alors gnralise dautres objets Total utilisent dj massivement les capteurs leur des donnes. Le Big Data est cens porter
potentiellement connects linsu de leurs pour leurs projets Big Data. Dbut 2014, Google une rvolution de la donne. Cette dernire de-
utilisateurs. Le parallle avec George Orwell investissait 2,3 milliards de dollars dans le ra- vient alors une arme puissante sur le plan co-
semble alors vident, nourrissant une certaine chat de la socit Nest Labs, confirmant que
psychose. Lquilibre est ncessaire et cest l nomique comme gopolitique. Dans la sphre
le march des objets connects est vou une
que se joue le rle de la CNIL et des instances prive, on parle principalement de viol de lin-
croissance impressionnante.
europennes, toutes conscientes de lurgence timit ou despionnage industriel, mais dans le
dune rglementation assurant et rassurant les Au-del de ce type de donnes, les entreprises domaine public il sagit bien de jeux de pouvoirs.
citoyens. dans leur ensemble dtiennent une masse din- Le Patriot Act cach derrire laffaire PRISM r-
formation considrable. Le volume de donnes vle comment le gouvernement amricain a mis
en place les conditions dune rcolte dinforma-
LA CRATION DEMPLOI
La croissance annonce et amorce du march
du Big Data a une consquence sur le march
de lemploi. Comme nous lavons vu, les projets
Big Data ncessitent une relle nouvelle fonc-
tion, celle de datascientist. Elle stimule ga-
lement toute la sphre conomique des SSII,
cabinets de conseils, intgrateurs, fournis-
seurs hardware Dans lensemble, lAfdel es-
time que 1 000 emplois directs seront crs en
France dici 2018. Au niveau mondial, le cabinet
Gartner a suscit leffervescence en annon-
ant en 2013 quil valuait la cration demploi
4.4 millions dici 2015. Prs de la moiti le
serait sur le territoire amricain. On comprend
donc le besoin de formation et la prolifration
des programmes acadmiques. Certains vont
mme jusqu penser que lducation nationale
devrait intgrer des modules de familiarisation
avec le codage et le traitement de la donne,
afin de susciter des vocations et dveiller la
curiosit ds le plus jeune ge. Les gnrations
venir seront certainement plus familiarises
avec les nouvelles technologies, mais les da-
tascientist demanderont quoi quil arrive une
formation spcifique.
4.4
IDRAC : 18 Mines : 140
Portraits
15
Axelle Lemaire : photo officielle - portail du gouvernement
AXELLE
LEMAIRE
SECRTAIRE DTAT
CHARGE DU NUMRIQUE
(Portrait)
18
ANNE LAUVERGEON
EX-PRSIDENTE DAREVA, RESPONSABLE DE LA COMMISSION INNOVATION 2030
ET PRSIDENTE DU CONSEIL DE SIGFOX (Portrait)
Photo : Bruno Levy pour Challenges
Arrtons lauto
french bashing!
[]
Tnacit, vision
stratgique long terme
et cohsion europenne
doivent primer.
Anne Lauvergeon est principalement connue mrique de suivre le rythme effrn de leur ses nouvelles gnrations linnovation, ou
pour sa carrire de femme daffaires la forte secteur, sans tre frein par des instances et du moins ne pas les inciter un raisonnement
personnalit. Ses annes chez Areva ont forg contraintes rglementaires. La commission anti prise de risque. Sans vouloir renier
son personnage. Surnomme Atomic Anne, prcise videmment quil faudra trouver un notre culture et nos particularits, il nous faut
lancienne sherpa du prsident Mitterrand a quilibre entre libre innovation et protection voluer avec notre entourage. Elle prend alors
parfois divis mais ses comptences ont sou- des donnes personnelles. Cest un idal. lexemple des tablettes numriques, parfaite-
vent t salues. voir quelles ides pour latteindre mergeront. ment dveloppes dans deux ples dattraction
qui sont pourtant deux pays trs diffrents: les
Elle a fait son entre dans la sphre numrique Avec Anne Lauvergeon sa tte, on se doit au tats-Unis et la Core du Sud. Il nexiste donc
en avril2013, lorsque Jean-Marc Ayrault, alors moins de prter attention aux recommanda- pas de recette universelle, mais une capacit
premier ministre, la dsigne la tte de la com- tions livres par la commission. La langue de ladaptation. Chaque pays conserve ses par-
mission innovation 2030. Sa mission? Dfinir, bois ne fait pas particulirement partie des ha- ticularits tout en favorisant les conditions
avec une quipe ddie, les sept ambitions bitudes de la femme daffaires, et le pragma- dpanouissement de linnovation.
stratgiques pour la France lhorizon tisme est souvent matre mot. Lors dune conf-
2030. Dans son rapport rendu en octobre2013, rence en petit comit organise par lESCP, Enfin, cela peut sembler paradoxal, elle prne
le Big Data figure part entire comme sec- Anne Lauvergeon expliquait justement certains ltat zro. Ltat en retrait, qui laisse son
teur clef pour lavenir conomique de la France. points sur sa vision de lentreprise, de ltat, conomie se dvelopper et les innovations
Elle devient alors porte-drapeau dune sphre sur le travail de la commission et le rle du nu- merger. Ltat qui ne cherche pas lutter
qui milite pour un dveloppement dun co- mrique dans lconomie nationale. contre la modernit mais plutt laccompa-
systme puissant du Big Data en France. Elle gner. En dfinitive, le rle de ltat pour favo-
cre mme la surprise en acceptant le poste de Dans un premier temps, et cest intressant riser linnovation consiste reconnatre les
prsidente du conseil de la startup SIGFOX en au regard de la mission de la commission, elle secteurs clefs o il mnera quelques grands
avril2014. Le numrique, elle y croit, et elle y dfinit le rle des tats. Un tat, selon elle, projets et crera un environnement favorable
jouera dsormais un rle actif. doit avoir une vision stratgique. Areva par pour les entreprises, leur laissant la charge
exemple, est le fruit de 50 annes de politique den faire bon usage.
Concernant le Big Data, la commission 2030 continue, mene au niveau europen, avec un
prconise 5 leviers dactions: lopen data objectif clair. Cependant elle le reconnat faci- Un point qui ne manque pas dchapper Anne
comme acclrateur dinnovation, la valorisa- lement, la formule ne sapplique quaux grands Lauvergeon est le manque de confiance dont
tion des donnes publiques (au sein des admi- secteurs stratgiques. Cest alors quintervient nous souffrons en France. Arrtons lau-
nistrations), la mise disposition de ressources le second rle de ltat: favoriser des cosys- to-french bashing clame-t-elle! Nous devons
technologiques au sein dun centre destina- tmes, crer des aquariums comme elle le avoir confiance en nos capacits.
tion de startups, laide lexport et le droit dit. Plus prcisment, cela signifie que lorsque
lexprimentation. ltat souhaite acclrer ou accompagner un Identifier les capacits de la France, ctait
secteur dit, il se doit de lui procurer les condi- justement lobjet de la commission 2030. Trois
Ce dernier axe peut paratre surprenant quand tions ncessaires son panouissement. Ses questions se sont poses ses membres:
on connat les discussions au sein de la CNIL outils? La fiscalit, la rglementation, ldu- o sommes-nous bons en France, que pou-
ou mme de lEurope. Le droit lexprimen- cation. Sur ce dernier point elle insiste forte- vons-nous dcliner en Europe et o y a-t-il une
tation viserait permettre aux acteurs du nu- ment, persuade que la France doit duquer forte demande mondiale?
19
donn naissance sept concours mondiaux pour que linnovation puisse tre exploite
de linnovation. Mondiaux? Ctait important ailleurs que dans un domaine unique. Dans
pour la commission de laisser les candidatures les faits, cela demande la cration de rseaux
ouvertes tous, travers le monde, avec pour sociaux dacheteurs des innovations, o les
seule contrepartie de sengager investir en ides se transmettent, se valorisent, sex-
France. Les premiers laurats ont dj t d- portent et senrichissent.
signs. Une belle vision de linnovation en somme, qui
ne serait non plus un outil pour son gnrateur,
Dans lensemble, la commission a reu plus de mais bien un moteur pour lconomie tout entire.
1200 dossiers de candidature depuis son lan-
cement en dcembre2013 jusqu dbut juil- Elle conclut sur ces quelques mots, qui tra-
let2014. Lexercice est mme vou tre rp- duisent bien la personnalit de cette femme
t tous les deux ans, selon une dclaration de de caractre: tnacit, vision stratgique long
Franois Hollande. terme et cohsion europenne doivent primer.
QUELQUES LAURATS
DE LA CATGORIE BIG DATA
DU PREMIER CONCOURS
MONDIAL DE LINNOVATION
LANC PAR LA COMMISSION.
PROJET: SNIPS
Snips est une startup spcialise en modlisa-
tion prdictive pour les villes. En sappuyant sur
des donnes de golocalisation ainsi que des
donnes de contexte, nous pouvons mesurer,
comprendre et anticiper les comportements
dans les villes, contribuant ainsi personnali-
ser et amliorer le quotidien des citadins.
Votre parcours:
Au-del de la fiche Wikipedia qui parle dun pas-
sage difficile au collge et au lyce Quel parcours
avez-vous suivi? Comment avez-vous commenc
fonder vos premires entreprises et pourquoi vous
tes-vous lanc dans cette aventure?
Vous et le numrique:
Do vient votre intrt pour le secteur du num-
rique? quel moment vous tes-vous dit que le Big
Data reprsentait un secteur davenir, de nouvelles
opportunits, une rvolution? Et comment est n
CaptainDash?
24
Techno
HADOOP blient larticle MapReduce: Simplified Data
Processing on Large Clusters.
ENFIN UNE SOLUTION En bref, ils expliquent concrtement comment
DENTREPRISE? cet algorithme distribu utilise des serveurs
x86 standard en cluster pour parallliser des
PAR JOS DIZ traitements dans le but danalyser en un temps
record un trs grand volume de donnes de tout
type. luvre chez un moteur de recherche
dj plus que prometteur lpoque. Bien en-
Par Big Data en entend tendu, MapReduce repose sur le systme de
lapplication de traitements gestion de fichiers en clusters GFS (Google File
System).
analytiques de grands vo- cette poque, Doug Cutting (ex-employ
du moteur de recherche Excite, dApple et de
lumes de donnes, Doug Cutting, pre dHadoop (Source_Cloudera)
Xerox Park) mne le projet dindexation Apache
Lucene (bibliothque open source Java pour in-
structures ou non. Depuis dexer et rechercher du texte), et son utilisation
longtemps, des technologies HADOOP 1 dans son moteur de recherche Nutch. Il voit
dans cet article la possibilit de rsoudre les
de streaming analysent en LA NOUVELLE STAR problmes de masses de donnes de Nutch.
temps rel des informations DE LANALYTIQUE EST NE Jusquen 2006, il intgre MapReduce et un sys-
tme de fichier distribu DFS son moteur. Il
entre alors chez Yahoo et cre un framework
sur des bus de donnes. Depuis quatre cinq ans, le framework open
source Hadoop est devenu synonyme de Big regroupant MapReduce et DFS quil baptise
Ces solutions souvent Data. Mme si au dpart, il neffectuait que des du nom que son fils donne son lphant en
traitements par lots (en batch) et donc en diffr. peluche jaune: Hadoop. Le logo sera cr par
onreuses (reposant sur des Les raisons de ce succs? Premire raison: la un ami graphiste. En juin 2009, Yahoo rend le
possibilit dutiliser moindre cot des algo- code source dHadoop public via un projet de la
environnements critiques) rithmes open source conus pour fonctionner fondation Apache.
analysent par exemple en sur des serveurs x86 standard, et capables de Au-del de MapReduce et HDFS (Hadoop dis-
rpondre trs rapidement des questions en tributed file system), de nombreux modules
continu des flux financiers analysant jusqu plusieurs ptaoctets din- viendront complter Hadoop, dont les princi-
formations. Et surtout une simplicit (relative) paux sont devenus des projets Apache part
pour dtecter des fraudes dutilisation et de dploiement indite. entire (top-level), parmi lesquels: HBase (mai
Enfin, Hadoop combine lutilisation de techno- 2010), Hive et Pig (septembre 2010), ou encore
comme du blanchiment logies de pointe trs apprcies ou trs inno- Zookeeper.
dargent. vantes: paralllisation des traitements, cluste- La version 1.0.0 du framework est disponible
ring, traitement et donnes sur un mme nud fin dcembre 2011.
dans une infrastructure distribue, fiabilit par En octobre 2013, Hadoop connat une volution
rplication des informations, etc. Et avec la ver- majeure de son infrastructure avec la version
Les systmes de gestion de sion 2: In-Memory, temps rel, haute disponi- 2.2.0 qui ouvre ce framework les portes du
bilit amliore Des technologies enfin por- temps rel, de lextensibilit fonctionnelle, du
donnes traditionnels peinent te budgtaire des PME. In-Memory, de lenvironnement Windows, etc.
ou se montrent inefficaces Enfin, outre les problmes de volumes difficiles
analyser avec les technologies classiques,
pour traiter les normes Hadoop permet denvisager la collecte et le Le centre nvralgique HDFS et MapReduce
traitement de donnes en volume comme lIn-
volumes dinformation ternet des objets et les multiples capteurs et Le cur dHadoop 1 est compos de deux mo-
senseurs, le RFID, les tweets, etc.
provenant du web (plus de 2 dules majeurs.
Inspir de Google File System et dvelopp en
milliards dinternautes), des Java, HDFS (Hadoop Distributed File System)
10 ans: des origines de MapReduce Hadoop 2.x sexcute au-dessus du systme de gestion de fi-
smartphones (7,3 milliards chiers de chaque nud dun cluster. Un nud o
en 2014), des tiquettes RFID, Pour apprhender ces technologies, un petit
historique simpose. Fin 2004, Jeffrey Dean et
sont stockes les donnes (et excuts les traite-
ments qui les concernent) sappelle un datanode.
tweets (7 To par jour), de Sanjay Ghemawat employs chez Google pu- HDFS stocke linformation sous forme de blocs
Facebook (500 To par jour),
des camras, des capteurs et
autres senseurs. Et plus de
75% de ces informations ne
sont pas structures ou
seulement semi-structures.
MapReduce 1 assume plusieurs rles. Il gre et Pig a t conu pour simplifier lutilisation des Malgr lemballement gnral, Hadoop 1 souf-
alloue aux applications les ressources du clus- API MapReduce exigeant de bonnes connais- frait de multiples carences, qui ont fait hsiter
ter, et excute les traitements appliqus aux sances Java. Yahoo a cr la plateforme de trai- grand nombre dentreprises. Parmi lesquelles:
donnes. tement de donnes Pig et son langage Pig Latin le serveur Namenode ntait pas prvu pour
Lorsquune requte est adresse Hadoop, (projet Apache). Efficace et simple, le langage tre rpliqu, le transformant en talon
elle est prise en main par un JobTracker qui Pg Latin (proche du scripting) permet dcrire dAchille de la plateforme;
coordonne les traitements entre Map et Reduce des applications excutes sur Hadoop (run- pas de partage entre les jobs (MapReduce
et assure le suivi des tches. Il distribue les time Pig) sans passer par MapReduce. Le d- et autres);
processus parallliss aux Task Trackers sur veloppeur charge les donnes, y compris dune volutivit limite: un seul JobTracker par
les nuds du cluster Hadoop en optimisant les source externe vers le cluster Hadoop, et les nud et un maximum de 4000 nuds par cluster;
changes. manipule. en cas de panne, toutes les tches taient
La fonction Map divise la demande initiale en supprimes (en cours ou en attente);
squences (cl, valeur) auxquelles vont tre Hive - Conu chez Facebook, ce projet Apache le temps rel et le streaming ntaient pas
appliqus le ou les traitements en parallle ouvre Hadoop au SQL afin de simplifier la ma- possibles;
(vitesse optimale). Chaque tche Map renvoie nipulation des donnes avec une syntaxe trs les mises jour dinformations savraient
un rsultat (cl-valeur). Puis un traitement proche du SQL (HiveQL). Hive offre des outils complexes, risques, voire impossibles;
(Shuffle & sort) remanie les rsultats pour re- dentrept de donnes (datwarehouse): extrac- la supervision tait encore primaire, et la
grouper ceux qui ont la mme cl. tion, transformation et chargement dinforma- gouvernance quasi inexistante.
La fonction Reduce prend ces rsultats et les tions provenant de diverses sources. Il stocke
Toutefois, les diverses communauts mobili-
ses sur et autour dHadoop se montrent trs
actives et linnovation sacclre. Comme le
prouve la version de rfrence Hadoop 2.2.0 pu-
blie en octobre 2013 par la fondation Apache.
MapReduce, JobTracker et HDFS dans le bateau Haddop 26 Comment Map et Reduce collaborent
LA REVOLUTION HADOOP 2
Plus quune autre version corrigeant des
manques, Hadoop 2 modifie son architecture
pour plus de scurit et douverture: haute dis-
ponibilit, temps rel, streaming ou encore au
In-Memory.
Projets
veaux de proximit, etc.) de type Facebook,
Twitter, LinkedIn ou Viadeo. Giraph est parti Falcon (incubation Apache) vise simplifier la
dun article publi par Google sur son systme gestion des donnes et de leur cycle de vie,
de Graphes appel Pregel. dcouvrir les schmas de donnes et les trai-
tements associs, offrir la rutilisation de ces
rgles ralises sans codage Bref, une gou-
Sans oublier: scurit, administration et vernance des donnes sur cluster Hadoop.
gouvernance
Projet Apache initi par Cloudera, Flume col-
Slection de quelques modules apportant ces lecte, agrge et transfre sr Hadoop de gros
indispensables dimensions pour une solution volumes de donnes (logs, vnements, etc.).
dentreprise. Lcriture de ces informations sur HDFS est r-
alise au fil de leau.
La passerelle de scurit Apache Knox (API
Rest) fournit un point daccs unique pour Apache Sqoop permet de rcuprer des don-
toutes interactions Rest/Hadoop. Il propose nes structures dans des bases de donnes
la gestion sur toute la plateforme Hadoop de ou des datawarehouses pour les dplacer sur
lauthentification (LDAP et AD), de la fdration un cluster Hadoop. Ensuite, il peut effectuer
SSO, des autorisations aux services, de lau- des oprations en les corrlant avec des infor-
dit, etc. Il gre les autorisations en workflow mations semi ou non structures sur Hadoop.
et vrifie les jetons dauthentification (rgles). Enfin, il renvoie un rsultat structur au format
Complte les mesures de scurit existantes des SGBD source.
dans Hive, HDFS, etc.
Ce panorama de quelques outils illustre les
Ambari joue un rle majeur dans lexploitation
grands progrs raliss par Hadoop en trois
et la supervision Hadoop. Une palette dj im-
ou quatre ans pour transformer cette plate-
pressionnante: gestion de la configuration fine
des services (et dploiement en cluster), su- forme en relle solution dentreprise: robus-
pervision des machines du cluster (possibilit tesse, volutivit, administration, scurit, gou-
de dcommissionnement, etc.), tableau de bord vernance, disponibilit, stockage De plus en
global (tat de services et excutions), ges- plus dexperts parlent (plus ou moins ouverte-
tion des habilitations (compatible LDAP), ges- ment) dHadoop comme stockage de rfrence
tions des jobs avec vues agrges et timelines des donnes, y compris pour les traitements
(+tracking utilisateur), audit, etc. transactionnels. Et la notion de Data Lake re-
prise par nombre de spcialistes semble bien
Apache Oozie est un outil de workflow pour aller dans ce sens.
planifier et coordonner les jobs sous Hadoop. Dailleurs, le ralliement de nombreux projets
Cette application Web Java peut combiner s- Hadoop de tous les gants de linformatique
quentiellement plusieurs jobs sur une seule (voire leur financement des pionniers Hadoop
unit logique. Intgr la stack Hadoop, il sup- en dizaines de millions de dollars) nest-il pas
rvlateur ?
Retrouvez la Les donnes utilises proviennent de sources Files considre les vnements survenus
vido anime de diverses, issues pour les deux tiers dONG, aux frontires, chaque vnement reprsentant
darticles de presse rcuprs via United ou une disparition ou un mort. Un unique vne-
Global Pulse Fortress et de plus de 15 journalistes relais. ment est caractris par plus de 20 points de
Le tiers manquant provient de sources ajou- donnes, toutes issues des sources prcdem-
tes par les quipes de Journalism++. Ces don- ment numres.
nes, non structures pour la grande majorit, Daprs les premires conclusions de ltude,
sont agrges, classes puis traites par un on peut estimer le nombre de migrants dc-
Voir lintgralit programme dextraction spcifique. Alors que ds aux frontires europennes entre 30 000
de linterview de jusqu prsent de nombreuses donnes res- et 50 000 depuis lan 2 000.
taient inutilises de par leur diversit, com- Le chiffre est impressionnant et rvlateur de
Robert Kirkpatrick plexit et multiplicit, The Migrant Files permet nombreux dysfonctionnements et contradictions
de les runir et den tirer des conclusions les des Etats-Membres de lUnion Europenne. Si
plus exhaustives possibles. The Migrant Files a t relay dans la plupart
Frontex, lorganisme europen issu du trait des pays de lUE, via des mdias tels Le Monde
Dcouvrez en dAmsterdam de 1997, est charg de mutuali- Diplomatique, LEspresso, El Confidencial, et
visualisation ser les informations et damliorer les proc- plus de 50 articles, les conclusions en sont
interactive les dures de gestion des frontires, flux de biens, ce jour relativement peu utilises dans le cadre
rsultats du projet personnes, services et capitaux. Il agrge entre gopolitique ou juridique.
autres la dtection des tentatives dimmigra- Certains politiciens sy sont intress, autant
Pulse Lab Jakarta tion, les dcs, checs, reconduites la fron- au niveau national qu lchelle de lUnion,
tire, demandes de droits dasile Le Frontex mais aucun na lobligation de mesurer ou
a ainsi dfini 8 zones gographiques autour prendre en compte ces chiffres.
de lEurope, aux caractristiques semblables. Ce que rvle galement The Migrant Files,
The Migrant Files sest appuy sur ces donnes cest la dangerosit de certaines zones par
et a observ en dtail lactivit de ces 8 zones rapport dautres. La zone de Lampedusa par
frontalires. La qualit des donnes subit une exemple, est tristement clbre pour la mor-
marge derreur de 10% environ. The Migrant talit des migrants qui tentent dy passer. Le
PROGRESSIVE
UN PROJET DANS LE SECTEUR DES LOISIRS: En 2007, Fabrice travaille sur Second Life, un
univers entirement virtuel, recrant une so-
LES COMMUNAUTS VIRTUELLES cit entire, avec ses individus, associations,
hommes politiquesle tout en 3D. Cest le pre-
X-FIELD PAINTBALL - Entretien avec Sbastien MUNIER, Directeur Gnral, PCB TEAM mier tre lablis en Europe par Linden Lab,
lditeur Californien de Second Life pour lin-
sertion de marques au sein de la plateforme.
Sbastien Munier nest pas un expert du Big Data. Lide de sa Ils travaillent alors avec de nombreuses en-
socit est venue avec son associ, Fabrice Tron, il y a environ 2 treprises du CAC40, qui peroivent rapidement
leur intrt tre prsent sur ce type de sup-
ans. Fabrice et Sbastien sont des entrepreneurs du numrique, port virtuel. Les marques profitent de ce nou-
tous deux ayant eu de prcdentes expriences en agences web. veau lieu de rencontre pour faire connaissance
avec leurs clients, de faon virtuelle mais ci-
Ils ont donc pendant longtemps rpondu aux problmatiques ble, par affinits communautaires. La puis-
numriques de leurs clients. sance du modle est dautant plus forte que de
nombreux utilisateurs se sont rellement pris
Finale du championnat Europen (Millennium Series) Chantilly, monde rel. Action identique dans le jeu.
34
volume dinformations rcoltes 3 millions
dutilisateurs ultra-qualifis en un temps re-
cord, incluant la golocalisation et permettant
la dtection de lead, requiert lutilisation de so-
lutions Big Data.
Un exploitant de terrain par exemple, pourra
bientt via une plateforme de golocalisation
reprer les pratiquants rpondant un certain
profil dans son entourage au temps-T, les ci-
bler, les adresser via un systme de RTB et les
attirer vers son terrain. Le business est alors
classique: la marque ou le terrain transmet un
push proposant une offre promotionnelle ses
leads.
Daprs Sbastien, deux types de pratiquants
Un des terrains les plus rputs au monde: SC Village, Los Angeles, Californie. sont cibler: les fans du jeu dans le rel et
les fans de jeux vido au sens large, qui pour-
ront prendre got X-Field et finalement aux
terrains de paintball rels. Lobjectif est l
dlargir la communaut autant que possible,
moindre cot et le plus rapidement possible.
Et sa reprsentation dans le jeu (positionnement exact des obstacles via Google Earth) Le dernier projet en cours chez PCB est celui
des communauts de musique lectronique
(Pink City Beats). Il est encore un stade em-
au jeu, recrant leur univers rel jusqu rpli- dagrger le maximum dinformation qualifie bryonnaire, ltape de captation de sa com-
quer leur mobilier lidentique. Les marques au niveau mondial, le tout depuis leurs petits munaut (600 artistes DJ internationaux dj),
prsentes sur la plateforme avaient donc des bureaux toulousains. mais prsente comme objectif sous-jacent la
informations prcieuses sur les gots de leurs Une leve de fond et 3 millions de tlcharge- volont pour les quipes de PCB de dmontrer
potentiels clients. ments plus tard, les plus grandes marques du le caractre duplicable de leur approche.
Suite cette exprience, Fabrice et Sbastien secteur sassocient toutes X-Field Paintball.
ont eu lide dexploiter cet univers des com- Cest eux qui sont alors prescripteurs auprs ce jour, X-Field en est sa seconde leve de
munauts. Savoir reconnatre des groupes de des pratiquants tout en participant au finance- fonds. Lobjectif immdiat est de passer de 3 6
personnes avec une affinit commune, les cap- ment de la plateforme. Leur intrt? Bnficier millions de tlchargements de la plateforme.
ter, dvelopper la communaut et la montiser de laccs leur communaut, fdre de faon Le projet autour du camping vient deffectuer
auprs de marques lies deviendrait leur nou- unique au monde. Cest en dautres termes une sa premire leve de fonds et dentrer en com-
veau business model. immense base de donnes, la plus grande, hy- mercialisation.
Concrtement, PCB Team a actuellement trois perqualifie, sur la communaut du paintball. long terme, la socit PCB et ses deux fon-
projets en cours, chacun centr sur un centre Comment les joueurs sont-ils attirs sur la dateurs souhaitent rpliquer leur fonctionne-
dintrt prcis: le paintball, la musique lec- plateforme? Grce une prcision sans gal. ment dans dautres secteurs de niche, essen-
tronique et le camping. Chaque terrain est reproduit, les actions relles tiellement dans des domaines sportifs. Les
X-Field Paintball est le premier projet quils rendues virtuelles, les marqueurs (nom des trois premiers projets seront l pour montrer
ont dvelopp, et le plus abouti. Si le secteur lanceurs de billes), les dcors, les mouvements la puissance de ces bases de donnes haute-
peut paratre surprenant, il faut tout dabord sont transcrits la lettre. Le joueur peut donc ment qualifies exploites avec des outils Big
noter que la communaut des passionns de retrouver le plaisir du jeu rel dans un univers Data. Lide, dans les rves les plus fous de
paintball reprsente plus de 20 millions de virtuel, avec des interactions au niveau mon- Sbastien, sera ensuite de croiser les diff-
pratiquants travers le monde. Cest la troi- dial. X-Field est mme all jusqu reproduire rentes communauts. Un scnario type: cet in-
sime communaut de sport extrme, derrire les terrains des championnats, en les mettant dividu, en vacances dans ce camping, joue sou-
le BMX et le snowboard aux USA. Ce qui est disposition quelques jours lavance afin que vent aux jeux vido, dont parfois au paintball,
dautant plus intressant, cest que la pratique les participants puissent sy entraner. Les plus et comme il naime pas les muses, quil a une
du paintball reprsente des coups similaires gros sponsors, comme lors des championnats voiture et quil est venu sans enfants, je peux lui
la pratique du golf. Un passionn est donc rels, diffusent leurs bannires de publicit envoyer une offre promotionnelle pour ce ter-
susceptible de ddier des budgets importants pour figurer en meilleure position sur le ter- rain de paintball moins de 30 minutes de son
pour son activit, et les marques de paintball rain. Cest un march de niche, avec huit dix lieu de vacances.
ont un fort intrt le capter (march mon- acteurs majeurs dans le monde, mais qui re- La seule question: la protection des donnes
dial de 200millions deuros dquipements prsente des enjeux forts pour ces quelques personnelles. L, la rponse de Sbastien sap-
et 1,3 milliard deuros de consommables les marques. La valeur ajoute de X-Field est de puie sur un principe dopt-in et une anonymisa-
billes). dtenir une information exclusive. tion maximale des informations. Lidentit no-
Fabrice et Sbastien ont donc dvelopp une En quoi ce projet est-il rellement Big Data? Le minative importe peu en fin de compte. Cest le
application mobile, teste sur le march au profil qui prime. Si la socit est capable de re-
pralable, qui atteint rapidement des centaines connatre un profil et de lui communiquer une
de milliers de tlchargements. offre, elle na pas besoin de connatre le nom
Leur communaut au sens large comprend les March mondial de de la personne concerne. Quoi quil en soit, les
pratiquants du paintball, mais aussi les indus- quipes garderont un il averti sur les recom-
triels (marques dquipements), les exploitants
de terrains de jeu, les ligues (des champion- 200millions deuros mandations de la CNIL et veilleront constam-
ment protger les donnes.
nats sont rgulirement organiss) et la presse
spcialise. En un peu plus de 6 mois, PCB dquipements.
a amorc ce nouveau mdia, lobjectif tant
35
UN PROJET DANS LNERGIE: COFELY SERVICES cation de patterns et typologies de clients, pour
que Cofely Services comprenne de manire
DEEPKI - Entretien avec Vincent BRYANT, Direction dactivits Efficacit nergtique, beaucoup plus fine les consommations de ses
Cofely Services, Groupe GDF SUEZ clients.
Mais l o lentreprise va plus loin encore, cest
en lanant une spin-off, DEEPKI. Comme lex-
Cofely Services, Groupe GDF SUEZ, est principalement connue plique Vincent Bryant, au 19e sicle, le monde
a cd la rue vers le ptrole aux tats-
pour ses services en efficacit nergtique. Rattach au DG Unis. De nombreux acteurs se sont prcipits
au Texas, ont achet une parcelle de terrain
de la socit, Vincent Bryant est en charge de dvelopper les et quelques pelles et pioches pour creuser.
nouvelles activits ayant pour vocation damliorer lefficacit Certains ont trouv du ptrole, dautres non et
beaucoup de pioches ont t vendues. Puis des
nergtique. entreprises dingnieurs ont propos danaly-
ser les sols pour identifier les gisements et les
Il nest pas DSI, il ne fait pas partie du dpartement R & D, mais meilleurs outils pour les exploiter, en orientant
il est linterface de ces mtiers. Son rle est dutiliser les ainsi les efforts l o il tait probable quil y ait
du ptrole. Cette cartographie des gisements
algorithmes de data analytics pour crer de nouveaux business. de ptrole a apport une grande valeur aux
chercheurs de ptrole, aux vendeurs doutils et
aux propritaires fonciers. Aujourdhui chez
Cofely Services a dvelopp il y a 2 ans loffre nire fine avec les consommations de struc- Cofely Services, nous voulons faire pareil
VERTUOZ, qui permet ses clients (plus de 41 tures similaires la mienne. souligne alors Vincent Bryant. La cartogra-
000 sites renseigns ce jour) de monitorer phie dveloppe par DEEPKI vise dtecter
leurs consommations en temps rel et dame- Pour Cofely Services, le Big Data est gale- les gisements dconomies dnergie grce
ner la Business Intelligence jusque chez ment un moyen de mieux connatre ses clients, aux donnes existantes du secteur priv, des
ses clients. et donc de mieux les conseiller. Loptimisation ministres, collectivits, mais aussi laide
Mais la data pour lefficacit nergtique, ce de la vente croise permet Cofely Services de de donnes ouvertes. Ces informations sont
nest pas que de la mesure. fournir ses clients des services parfaitement structures, segmentes en classes de bti-
Comme lexplique Vincent Bryant, il existe 3 adapts leurs besoins. En complment des ments laide dalgorithmes, puis traites avec
niveaux dutilisation de la donne. Le pre- donnes CRM dj prsentes, les algorithmes un moteur dinfrence.
mier correspond la mise en place dun sys- de data-analytics viennent tirer plus de va-
tme denergy monitoring pur: connatre ses leur des donnes volumineuses et complexes Les quipes obtiennent des cartographies de
consommations relles au temps-T, en garder existantes utilises par les quipes marketing. gisements dconomies dnergie compl-
une trace. Le second niveau consiste intgrer titre dexemple, un seul client peut repr- tes par des diagnostics ou des systmes de
des fonctionnalits BI (Business Intelligence) senter plus de 1 000 sites, chaque site ayant mesures. La dmarche permet donc dex-
pour mieux comprendre et exploiter ces don- ses propres caractristiques de consomma- clure les cas particuliers, et daffiner autant
nes. Le troisime niveau, qui nous intresse tion, denvironnement, dactivitLe Big Data que possible les tudes. Dans lnergie, cest
ici, sattaque au Big Data en intgrant des don- chez Cofely Services est donc pass par la une petite rvolution: il ne sagit plus unique-
nes externes, des volumes de donnes impor- construction dun outil de Data Discovery ment de mener des tudes physiques, mais
tants et un traitement en quasi-temps rel. puissant mis disposition des quipes. Je bien de crer une cartographie pralablement.
Dans ce contexte, le Big Data peut servir au connais mon client pour mieux lui vendre mes Ces puissants algorithmes utilisent des outils
Benchmark: connatre combien je consomme services, et mon client bnficie ainsi dune statistiques bien connus des socits de pro-
est intressant, mais cette donne prend tout rponse adapte au plus proche de ses be- motion publicitaire sur le web. Le principe est
son sens lorsque je peux la comparer de ma- soins. Loutil a galement engendr lidentifi- relativement simple: alors quon aurait ten-
36
UN PROJET DE RECHERCHE: LA GNOMIQUE
France GENOMIQUE - ENTRETIEN AVEC PIERRE LE BER ET PIERRE LECA
40
UN PROJET EN CLIMATOLOGIE: LVOLUTION CLIMATIQUE AU
NIVEAU MONDIAL
Projet DADA - Entretien avec Alexis Hannart, Climate Scientist au CNRS
Dans cette partie, retrouvez les acteurs de lcosystme Big Data qui font lactualit
en France et ltranger. Ils ont souhait vous faire part de leur vision, de leurs
principales volutions technologiques ou de leurs plus belles ralisations.
Au cours de ces quelques pages, apprenez les connatre ou les redcouvrir,
car ce sont eux qui participent la croissante maturit du Big Data en France.
Que vous soyez la recherche de partenaires et fournisseurs, ou tout simplement
passionn du sujet et attentif aux volutions de ses protagonistes, cette partie
vous intressera.
42
Equipementiers Hardware Editeurs Software Editeurs BI
Editeurs Dataviz Consultants SSII Intgrateurs Institutionnels
ACTUATE 44
A.I.D 46
AMAZON WEB SERVICES 48
BIME ANALYTICS 50
BITTLE 52
BLUESTONE 54
CAPGEMINI 56
CENTRALE FORMATION 58
CLOUDERA 60
CLUB DECISION DSI 62
CSC 64
DATASTAX 66
EDIS CONSULTING 68
EKIMETRICS 70
EXALEAD DASSAULT 72
SYSTEMES
GFI INFORMATIQUE 74
HP 76
IBM 78
KEYRUS 80
MICROPOLE 82
NEO TECHNOLOGY 84
PENTAHO 86
PIVOTAL 88
QLIK 90
SAP 92
SAS 94
SCINETIK 96
SEMDEE 98
SENTELIS 100
SINEQUA 102
SPLUNK 104
SYNCSORT 106
TABLEAU SOFTWARE 108
TALEND 110
TERADATA 112
TIBCO JASPERSOFT 114
VISEO 116
Fournisseurs 43
ACTUATE
COORDONNES Actuate aide les entreprises exploiter les sources de donnes htrognes dont le Big Data
pour la prise de dcision et la diffusion dinformations personnalises en proposant des
ACTUATE FRANCE rapports, des analyses et des tableaux de bord interactifs, accessibles un grand nombre
dutilisateurs depuis une interface Web ou mobile.
57, rue de Chteaudun
75009 Paris
Tl +33 (0)1 76 21 56 50
Mail fr_contact@actuate.com
La plateforme dcisionnelle BIRT IHUB dActuate offre des visualisations de donnes interactives,
intuitives et personnalises travers des outils analytiques et des tableaux de bord pouvant tre
facilement dploys auprs de millions dutilisateurs travers le web et le mobile.
Les applications construites avec BIRT IHUB sont idales pour la diffusion de masse
dinformations personnalises. Actuate aide ainsi les entreprises tirer pleinement parti
du Big Data et de lessor des appareils tactiles.
Dveloppement
BIRT Designer Pro cr des contenus bass sur la technologie BIRT Open Source
Dploiement
BIRT IHUB gre jusqu des millions dutilisateurs via des clusters de servers haute disponibilit
BIRT Mobile visualise des contenus BIRT sur des supports mobiles tels que smartphones et tablettes
Visualisations
BIRT Viewer permet la visualisation de rapports BIRT statiques
BIRT Interactive Viewer permet aux utilisateurs de visualiser et de personnaliser leurs
rapports en toute libert
BIRT Studio donne aux utilisateurs la possibilit de dvelopper leurs propres rapports web
Ad Hoc, les donnes restant sous le contrle de la DSI.
BIRT Analytics
BIRT Analytics est la solution danalyse exploratoire et prdictive des donnes qui permet
de raliser des tudes partir de nimporte quelles sources de donnes dont le Big Data
sans besoin de connaissance techniques et statistiques spcifiques.
A la main des utilisateurs mtier, BIRT Analytics offre galement la possibilit de concevoir
des campagnes et den prdire les retombes.
45
www.actuate.fr
A.I.D.
Nos clients tels que AUCHAN, BOUYGUES TELECOM, CRDIT MUTUEL ARKEA, DARTY,
EDF, MOBIVIA GROUPE (NORAUTO, MIDAS...), PMU, PUY DU FOU, RENAULT, SEPHORA,
SFR, SIMPLY MARKET, SYSTEME U, TRUFFAUT, nous recommandent avec une note moyenne
suprieure 8/10
(Enqute ralise 2 fois par an sur la base du Net Promoter Score).
Depuis plus de 40 ans, A.I.D. innove continuellement dans le traitement et lanalyse des
donnes. Notre R&D est la garantie que nous apportons nos clients les solutions les plus
performantes leurs problmatiques BtoB et BtoC autour du Datamining, de la Dataquality,
du CRM, du CIM et de lHbergement.
Customer Interaction Management
Visualisation des parcours clients cross-canal
(achats magasins, site e-commerce, call center, rseaux sociaux)
@ @
Achat infos produit
infos produit
MAgAsin WEB
WEB
infos
Achat
WEB
Rception
E-MAiL
Achat CALL CEnTER
MAgAsin
Visite Publication Publication
MAgAsin TWiTTER FACEBOOK
57 456 CLiEnTs
sMs
47
www.aid.fr
AMAZON WEB SERVICES
COORDONNES Amazon Web Services (AWS) est une compagnie dAmazon.com, cre en 2006, qui offre
ses clients un accs des services dinfrastructure dans le cloud afin de leur permettre de
AMAZON WEB SERVICES INC crer des applications sophistiques et extensibles.
410 Terry Avenue North, Seattle, WA Aujourdhui, AWS offre plus de quarante services ses centaines de milliers de clients,
98109 grandes et petites entreprises, dans 190 pays, tout en tant un rel moteur pour linnovation
dans de nombreux domaines comme les mdias, la finance, le e-commerce,
Tl +33 (0)1 46 17 10 08 Amazon Web Services propose notamment aux scientifiques, dveloppeurs et aux autres
professionnels ayant des problmatiques Big Data, de tirer parti du cloud pour effectuer
Mail lavocats@amazon.fr leurs analyses et relever les dfis lis laugmentation du volume, de la diversit et de la
vitesse des informations numriques. En effet, Amazon Web Services fournit un catalogue
complet de services cloud afin daider ses clients grer le Big Data pour obtenir un avan-
tage concurrentiel et augmenter leur rythme dinnovations. Plus de dtails sur les services
CONTACT Big Data du cloud AWS : http://aws.amazon.com/fr/big-data/
Stphanie
LAVOCAT
Cloud-based services
for Big Data
Manage, Analyze and
Increase Innovation
;sl
pa kk
ihg iuo
uihmginhu
g af lakg
poillfhla
gfafhlag ag jjuakg
dsafhfhlag yy6uakg
vsgsfgc g dsa
dchfhlag g
iiegjh kl, uaf lak
saffynmffd g
dsa lk;
jgh sd d fhlaghgg
qwmjkk fd
jgl 0f
mn
Lide nouvelle du Big Data est de rassembler la totalit des donnes dusages historiques
disponibles (logs, donnes patrimoniales, rseaux sociaux...) sans pr-formatage ou
pr-filtrage, puis de traiter ces donnes a posteriori sur des historiques de plusieurs mois
voire plusieurs annes.
Se lancer dans un projet de Big Data dans le cloud apporte une valeur unique par rapport
des infrastructures sur site, notamment dans les tapes de stockage et danalyse:
Stockage lastique : le principe est davoir une capacit illimite dans laquelle les clients
ne paient que pour le stockage rellement utilis, sans engagement dans le temps.
Cest dans ce domaine que les technologies lastiques proposes par le cloud Amazon
Web Services prennent tout leur sens. Larchitecture informatique lastique (stockage, ser-
veurs...) propose par AWS sadapte aux projets Big Data ponctuels ou rcurrents des entre-
prises de toutes tailles.
49
BIME ANALYTICS
COORDONNES BIME est un service de Business Intelligence moderne. N dans le Cloud et dimmensionn
pour vos Big Data, BIME a t pens pour les entreprises devant mixer leurs donnes pour
BIME ANALYTICS identifier leurs facteurs cls de russites. BIME masque la complexit pour lutilisateur
mtier : il ne ncessite aucune infrastructure complexe, ni serveurs, ni logiciel client. Un
1 place Francis Ponge simple navigateur, uniquement.
34000 Montpellier
BIME se connecte aux nouvelles sources de donnes en ligne telles que Salesforce, Twit-
ter, Facebook, Youtube, Google Analytics ainsi quaux donnes installes dans lentreprise -
Tl +33 (0)4 67 41 60 35 base de donnes propritaires comme Oracle, Excel et plus. Ralisez vos analyses person-
nalises et transposez les en graphiques visuels interactifs pour crer vos propres tableaux
Mail stephan.khattir@bimeanalytics.com de bord. Partagez-les en temps rel via un simple lien URL : consultez et modifiez-les sur
tablette ou mobile pendant vos dplacements.
BIME propose une srie de connecteurs Big Data tels que Google BigQuery, Amazon
Redshift, SAP HANA, HP Vertica et propose des solutions de Stockage Cloud extensibles
CONTACT pour analyser vos flux de donnes, sans limite. Depuis votre navigateur.
Stephan La nouvelle version BIME V6 marque une tape importante dans lre des applications de
Business Intelligence. Sinspirant des meilleurs applications grand public, elle prsente
KHATTIR
une interface utilisateur de nouvelle gnration, fluide, rapide, claire et lgante. Toute
la complexit habituellement associe aux outils BI disparat au profit de lefficacit et du
Directeur des Ventes EMEA plaisir de travailler sur vos jeux de donnes.
BIME V6 vous accompagne toute la journe pour rpondre vos questions mtiers au fur
et mesure quelles se posent. Vous ne serez pas uniquement dans la consommation de
tableaux de bord construits par vos analystes mais vous pourrez les interroger, posez vos
propres questions, nimporte o, depuis votre tablette aussi facilement que lorsque vous
crez une prsentation. Utilisez lintgralit du Cloud comme votre propre data warehouse,
crez et partagez vos analyses la qualit visuelle la plus moderne.
Weekendesk.com,
Business Analytics 100% en ligne
Porteur du projet
Adrien Charaix, Business Analyst / Contrleur de gestion. adrien.charaix@weekendesk.fr
Objectifs
Weekendesk est une agence de voyage 100% en ligne, leader de la vente de courts sjours
en Europe. Le site gnre plus de 46M de Volume dAffaires sur les 3 pays que sont la
France, la Belgique et lEspagne. Port par le dpartement Finance & Business Analytics,
leur projet BigData sarticulait dabord sur une logique de sortie du Reporting en silo, d
lhtrognit de leurs sources de donnes. Il sagissait en priorit dagrger des donnes
financires et de les mixer avec celles du trafic de leurs sites web et du comportement de
leurs consommateurs.
Prsentation
a. Nature des donnes traites : Weekendesk est un site web marchand dont les 25000
commandes par mois gnrent un important volume de donnes transactionnelles entre
les clients et les htels. Weekendesk analyse aussi constamment lvolution de son trafic et
son taux de conversion clients en rapport avec son offre produit et/ou service de son cata-
logue. Avec plus de 2 millions de visites par mois en moyenne, Weekendesk utilise Google
Analytics. Les donnes transactionnelles de rservation sont stockes dans des bases de
donnes SQL et un ERP propritaire en ligne. Dautres donnes sont disponibles dans le
Google Drive de lentreprise.
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne) : Le Reporting tait prcdemment produit via Excel avec une
multitude de tableaux croiss dynamiques associs et donglets, pour couvrir tous les in-
dicateurs cls des diffrents dpartements mtiers. Ce Reporting a rapidement atteint les
limites techniques dExcel (volumtrie croissante et problme de disparit des donnes),
devenant difficilement exploitable. En slectionnant BIME, Weekendesk peut dsormais re-
produire son schma de Reporting initial avec comme amlioration majeure la fluidit de
se connecter nativement toutes les sources de donnes (SQL, Google Analytics et Drive)
depuis un seul et mme endroit, puis dagrger les informations en quelques clics, pour en-
fin construire et partager des tableaux de bord de pilotage en ligne avec le top management
et les diffrents dpartements.
c. Calendrier de dploiement : Le projet a dmarr en avril 2014. La Direction analyse les
tableaux de bord depuis aot 2014. Weekendesk a fait appel un intgrateur pour travailler
en amont les connexions on premise aux bases de donnes SQL.
Aspect Novateur
Weekendesk est une socit 100% web, oriente cloud et mobilit. Chaque employ doit im-
prativement accder ses donnes mtiers depuis nimporte o. La solution de Business
Intelligence de BIME, 100% web correspond parfaitement cet ADN. Grce la gestion des
profils et droits utilisateurs, chaque Business Analyst rentabilise son temps de production
des analyses. Un mme tableau de bord, agrgeant plusieurs sources de donnes, peut
en effet tre partag avec le Comit de Direction et les dpartements mtiers. Le Comit
accde aux informations globales de lentreprise tandis que les mtiers (vente, marketing)
ne voient quun primtre autoris.
Valorisation observe de la donne
Exploitation de la richesse du croisement des informations multi sources dans les tableaux
de bord, la vole, au mme endroit et en ligne. Production simplifie de graphiques vi-
suels permettant une comprhension rapide des performances des canaux dacquisition.
Visibilit accrue des rsultats des ventes web par rgion, par canal de vente (force de vente
interne, service client, pur web), par source (ordinateur, tablette, smartphone), dans un
contexte croissant de volume de donnes. Actualisation real time des indices de comptiti-
vit des offres, disponibles en ligne pour les mtiers, chacun tant capable dexcuter des
requtes adhoc pour rpondre leur question.
Etapes venir et dmarche Big Data dans lentreprise
Optimisation, augmentation et mix des collectes de donnes de ventes et de rservations
pour renforcer la granularit de lanalyse au client prs. Objectif : migrer les donnes CRM
(dont Salesforce) & Marketing (dont les donnes dAttribution comme C3 Metrics) dans
Google BigQuery pour produire des tableaux de bord des profils clients et de leurs com-
portements dachats, le plus rapidement possible. Bnficier des technologies Cloud pour
rester fidle lADN Web de Weekendesk et disposer dune plateforme danalyse puissante
connecte en direct toutes les sources de lentreprise, pouvant grandir linfini.
51
www.bimeanalytics.com
BITTLE
COORDONNES BITTLE est le premier moteur dcisionnel conu et imagin pour fonctionner en mode
Cloud Computing. Loffre est propose en mode web selon le principe du Software as a Ser-
BITTLE vice (SaaS), et dispose de capacits de traitement et de stockage quasi illimites.
235 Rue Denis Papin Fonctionnellement, BITTLE permet de suivre et piloter les indicateurs cls de lensemble
Domaine du Tourillon Bt C des activits de la socit, en analysant les donnes sources de manire simple, efficace et
ludique. BITTLE sadresse tous types de structures qui recherchent une solution dcision-
13 857 AIX EN PROVENCE Cedex 3 nelle complte, package et prte lemploi permettant de crer et de partager facilement
Tl +33 (0)4 42 12 54 57 des tableaux de bord dans un environnement entirement scuris.
Mail contact@bittle-solutions.com Notre vision est dapporter aux marchs viss une plateforme de Business Intelligence
communautaire, comprhensible par tous (aucune comptence technique en informatique
requise). Marketing, Ventes, RH, Finance, Achats, Informatique quel que soit votre mtier,
Bittle vous permettra de suivre vos indicateurs et analyser vos donnes.
CONTACT
Christophe Toutes les organisations, quelque soit leur taille, prives ou publiques, sont de plus en plus
demandeuses de solutions de Business Intelligence pour grer lensemble de leurs acti-
SUFFYS
vits. Les solutions prsentes sur le march ne rpondent cependant pas leurs besoins,
pour diffrentes raisons, que ce soit la complexit de ces solutions, leur cot, ou encore les
Prsident dlais de mise en uvre.
MY BIGDATA MY DECISION
Depuis sa cration, Bittle a pour ligne de conduite de vouloir rvolutionner la
faon dapprhender la Business Intelligence. Bittle dcide maintenant daller
encore plus loin en rvolutionnant le march du Big Data avec le mme souci de
dmocratisation.
La plateforme BittleGoBig permet ainsi de travailler sur les donnes de masse qui
peuvent tre gnres au travers de diffrents types dvnements.
La seule solution
intgre de Big Data la porte de tous!
BittleGoBig
My BigData, My Decision
Depuis sa cration, Bittle a pour ligne de conduite de vouloir rvolutionner la faon dap-
prhender la Business Intelligence. Bittle dcide maintenant daller encore plus loin en
rvolutionnant le march du Big Data avec le mme souci de dmocratisation.
Prsentation
La plateforme BittleGoBig permet de travailler sur les donnes de masse qui peuvent tre
cres au travers de diffrents types dvnements. Elle permet, entre autres, des utili-
sateurs de gnrer des donnes qui ne sont actuellement pas traites informatiquement,
comme par exemple des indicateurs dutilisation, de satisfaction, de ressenti, ou encore des
comportements dutilisateurs sur des sites internet, ou sur une application mobile.
Loffre BittleGoBig se dcoupe en deux grandes parties. La premire partie sarticule au-
tour de la cration dun moteur OLAP bas sur des technologies Big Data, appele Bittle
Foundation. La seconde partie est la mise en place de connecteurs permettant la r-
cupration de donnes simplement au travers dune multitude de sources, appele Data
Mixture.
Socle technologique de BittleGoBig, Bittle Foundation permet Bittle de supporter les
Big Data, sur deux aspects:
- Le stockage et linterrogation des donnes permettant davoir des tableaux de bord tou-
jours aussi ractifs quel que soit le volume trait.
- Lalimentation en masse, permettant le temps rel, lors de limport de donnes.
Data Mixture est une vritable bote outils, permettant aux utilisateurs de collecter et
mixer des donnes la vole provenant de sources multiples, imagine pour les utilisateurs
ne possdant quun lger vernis technique.
Ce module est aussi un puissant middleware destination du dpartement informatique
dsireux de rcuprer facilement les donnes produites par les applications existantes au
sein du SI de lentreprise via des APIs intgres.
Aspect Novateur
Laurat du Concours Mondial de lInnovation 2030, Bittle innove dans sa proposition en in-
tgrant diffrentes composantes permettant de couvrir tous les aspects du Big Data tout en
le rendant plus accessible et plus simple.
Comment ? Les outils ddis au Big Data ncessitent aujourdhui des connaissances tech-
niques, afin de comprendre les concepts utiliss et pouvoir mettre en place de tels sys-
tmes.
Bittle ayant dj russi simplifier le dcisionnel standard, pour que des utilisateurs sans
connaissance technique puissent facilement donner du sens leurs donnes, veut mettre
tout son savoir-faire et son exprience pour reproduire ce succs en dmocratisant la mise
en place de systme Big Data.
De plus Bittle, ayant dj dvelopp un ETL accessible
des utilisateurs sans connaissance technique, va rvolu-
tionner la rcupration et la gnration de donnes de
masse au travers de la mise en place de son module Data
Mixture tout en gardant cette phase simple dutilisation
et extrmement graphique.
Bittle deviendra donc par consquent le rceptacle central
des donnes de chaque entreprise, et le meilleur moyen
de communiquer tant en interne quen externe ... le tout
sans tre informaticien.
Valorisation observe de la donne
Les cas dutilisation de BittleGoBig sont multiples. Ils
vont du secteur des Facilities, pour une optimisation de la
consommation nergtique des btiments en traitant une
trs forte volumtrie de donnes issues des compteurs
mais aussi de sondes ou de capteurs, au secteur des t-
lcommunications, pour analyser les vnements sur les
rseaux mobiles, en passant par le marketing et lanalyse
comportementale, la golocalisation, ou encore le web,
pour suivre et analyser les actions effectues par les in-
ternautes sur un site ou une application web.
53
www.bittle-solutions.com
BLUESTONE
Dans chacun de ces domaines, nous disposons dune quipe de consultants ayant dvelopp
une comptence et une exprience spcifique en la matire, qui nous permet dassurer un
relais efficace entre les besoins mtier de nos clients et les rponses scientifiques et techniques
que nous leur apportons.
Dveloppement dune plate-forme
de scoring de brevets
Porteur du projet
Caisse des Dpts Proprit Intellectuelle
Objectifs
Le march des brevets est ce jour un march encore peu transparent, sur lequel il est
difficile -et coteux- de disposer dune valorisation objective des biens changs.
Le projet sinscrit dans ce contexte, et a pour objectif de dvelopper une plate-forme per-
mettant -sur la base des nombreuses informations publiques disponibles- de noter len-
semble des brevets europens, et de mettre cette information disposition du public
concern (industriels, fonds dinvestissement).
Le principe de la notation repose sur une hypothse simple : les dcisions administra-
tives prises par le dposant dun brevet diffrentes tapes de son cycle de vie rvlent
la qualit de linvention que le brevet protge. Ds lors, la modlisation de ces dcisions
administratives , mises en relation avec des caractristiques observables du brevet (le
texte mme du brevet, le schma de citations inter-brevets), permettent dlaborer des
modles prdictifs de la dure de vie des brevets, et ainsi dapprocher leur valeur.
Prsentation
Nature des donnes traites : Les donnes traites portent sur lensemble des brevets
europens. Il sagit pour certaines de donnes structures (classification internationale
pour les domaines technologiques, citations de brevet brevet, cycle de vie administratif
du brevet), et pour lessentiel de donnes non structures (texte des revendications et des
descriptions, en franais, anglais ou allemand). Ces donnes sont collectes partir du
rfrentiel de brevets de Questel (fournisseur de donnes spcialis), et du site de lOffice
Europen des Brevets.
Ressources et mthodologie : Lensemble des donnes collectes est transform puis stoc-
k et historis sur une plateforme Hadoop.
Les processus algorithmiques de calcul des notes qui impliquent des traitements statis-
tiques complexes, ainsi que des traitements de type textmining sur de gros volumes- sont
excuts automatiquement sous forme de batch, ou la demande selon le paramtrage
choisi par lutilisateur (slection dun rfrentiel de calibration des modles, modification
des caractristiques des brevets valus).
Calendrier de dploiement : Aprs plusieurs exprimentations et tests en grandeur nature
auprs dutilisateurs pilotes, une premire version accessible au public sera lance au prin-
temps 2015.
Aspect novateur
Le scoring labor dans le cadre de ce projet est le seul qui permette une combinaison algo-
rithmique de nombreuses caractristiques des brevets, dont certaines issues dune approche
textmining peu ou pas utilise jusquici. Laccent est galement mis sur la possibilit de d-
composer le score selon les caractristiques les plus influentes du brevet, ce qui garantit
la transparence des algorithmes de calcul utiliss. Enfin, les utilisateurs les plus avancs
peuvent choisir un univers de rfrence pour la calibration des modles, et obtenir des notes
pour leur portefeuille et ceux de leurs concurrents aussi pertinentes que possible.
Valorisation observe de la donne
La notation des brevets propose permet de nombreux usages pour diffrents types dac-
teurs de la proprit intellectuelle. Dans le cadre dune revue de portefeuille acqurir, elle
peut par exemple aider des experts valuateurs de brevets identifier plus rapidement les
meilleurs brevets. Elle permet de prendre en compte le portefeuille de brevets dune soci-
t pour aider aux dcisions dacquisition ou de financement. Au sein dun dpartement de
proprit intellectuelle, elle offre aussi un moyen de valoriser son portefeuille par rapport
celui de ses concurrents
Etapes venir et dmarche Big Data dans lentreprise
Les mois qui viennent vont permettre de porter lensemble des traitements en environne-
ment de production.
En outre, les algorithmes de notation seront probablement encore affins pour tenir compte
des retours des premiers utilisateurs. Pour cela, il est notamment envisag dorienter le
projet vers une logique dopen innovation grce la plate-forme datascience.net.
55
www.bluestone.fr
CAPGEMINI
COORDONNES Dans un monde constamment connect , les sources de donnes se sont multiplies,
des puces RFID aux transactions en ligne en passant par les analyses des codes QR et les
CAPGEMINI messageries instantanes des rseaux sociaux. Non seulement le volume de donnes gr
par les entreprises a explos, mais analyser le pass ne suffit pas : pour pouvoir bnficier
7, rue Frdric Clavel dun vritable avantage concurrentiel, vous devez anticiper lavenir.
92287 Suresnes Cedex
Cest l que lexpertise Big Data de Capgemini entre en jeu. Car si le march volue et les
solutions Big Data se dmocratisent rapidement, les entreprises peuvent encore avoir des
Tl 01 49 00 40 00 interrogations sur les choix technologiques, dinfrastructure ou dorganisation. Capgemini
dispose dun solide savoir-faire avec notamment un centre dexcellence, un lab et des
Mail valerie.perhirin@capgemini.com quipes exprimentes.
A propos de Capgemini
Fort de plus de 130 000 collaborateurs et prsent dans plus de 40 pays, Capgemini est lun
CONTACT des leaders mondiaux du conseil, des services informatiques et de linfogrance. Le Groupe
Valrie a ralis en 2013 un chiffre daffaires de 10,1 milliards deuros.
PERHIRIN Avec ses clients, Capgemini conoit et met en uvre les solutions business et technolo-
giques qui correspondent leurs besoins et leur apporte les rsultats auxquels ils aspirent.
Responsable France de loffre Big Data Profondment multiculturel, Capgemini revendique un style de travail qui lui est propre, la
Collaborative Business ExperienceTM , et sappuie sur un mode de production mondialis,
le Rightshore .
Porteurs du Projet
La division Global Solution dun acteur international dans le secteur des Tlcoms, trs
prsent en Europe et en Amrique du Nord
Objectifs
Notre client a missionn Capgemini pour dvelopper une solution sappuyant sur des ou-
tils Big Data afin de : Prdire les futures hausses du trafic sur des marchs et des rgions
spcifiques Identifier les zones o le rseau tait surdimensionn ou sous-dimensionn
Identifier les zones o la croissance du trafic pourrait amener des opportunits de ventes
supplmentaires.
Prsentation
Notre client cherchait optimiser son rseau, amliorer sa qualit de service et iden-
tifier des modles de comportements sociaux permettant dinitier de nouvelles activits
gnratrices de revenus. Pour y parvenir, la socit a d convertir ses donnes relatives
lutilisation de son rseau en informations effectivement exploitables. La socit craignait
notamment que le trafic rseau, pour ses offres de gros destines aux entreprises, ne soit
en baisse en raison dune concurrence agressive obligeant les socits offrir des prix plus
bas aux clients.
a. Nature des donnes traites :
Capgemini a fourni au client une solution lui permettant danalyser ses donnes via de
nombreuses sources dont :
le trafic rseau les informations sur les lignes rseau la qualit de service les infor-
mations sur les systmes autonomes les donnes dmographiques
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne)
Capgemini a tir parti des modles de thermodynamique sociale qui permettent deffectuer
des analyses et des prdictions sur lutilisation du rseau.
Les rapports ont t produits via la solution SAP Business Objects BI 4.1. Cloudera
Enterprise 4.5 a t utilis comme plate-forme Big Data, tandis que les requtes ont t
traites directement avec Cloudera Impala.
La solution incluait galement :
Lutilisation des mthodes agiles Lintroduction dun outil ESB/ELT pour lintgration des
donnes Lutilisation dun processeur graphique (GPU) pour parallliser grande chelle
les calculs thermodynamiques Lutilisation dun modle thermodynamique pour lanalyse
de donnes
c. Calendrier de dploiement : Confidentiel
Aspect Novateur
Utilisation dalgorithmes scientifiques permettant de mieux modliser le trafic internet
et le comportement des routeurs rseau.
Utilisation de technologies Hadoop Cloudera dans le cloud AWS, pour une plus grande
flexibilit de calcul.
Valorisation observe de la donne
Durant la premire phase du projet, les donnes ont t transfres et centralises dans
un Enterprise Data Hub. La solution Enterprise Data Hub de Cloudera offre une plus grande
souplesse et ractivit dans le stockage et lanalyse des donnes, tout en permettant au
client de rduire considrablement ses cots.
Le projet a galement permis au client de dtecter lavance les zones gographiques de
son rseau o il pourrait cibler ses investissements.
Autres bnfices notables pour le client :
Amliorations oprationnelles Identification de nouvelles opportunits commerciales
Amlioration de lappui stratgique aux activits commerciales Rapports dentreprise
plus flexibles, toutes les informations tant disposition dans un rfrentiel unique Pr-
dictions de rsultats plus prcises grce lutilisation des modles thermodynamiques
Etapes venir et dmarche : Confidentiel
57
www.fr.capgemini.com
CENTRALESUPLEC
EXECUTIVE EDUCATION
Hard Soft B.I. Dataviz Conseil Instit.
Objectifs de la formation
COMPRENDRE les enjeux des Big Data IDENTIFIER les opportunits travers lopen
data et les cas dusage mtiers ACQURIR le vocabulaire li cet cosystme complexe
ADAPTER la stratgie dentreprise MATRISER les enjeux juridiques et lis la protection
des donnes ACQURIR les technologies des Big Data (acquisition et stockage des
donnes, traitement distribu, analyse de donnes large chelle) MATRISER les
technologies par des tudes de cas concrtes CONCEVOIR un projet Big Data.
Documentation et catalogue
www.cf.ecp.fr
Conseil et accompagnement
01 41 13 16 14 / info@cf.ecp.fr
EXECUTIVE
EDUCATION
Le monde change. Nous vous aidons changer.
Interview de Marie Aude Aufaure
59
www.cf.ecp.fr
CLOUDERA
COORDONNES Cloudera rvolutionne la gestion des donnes dentreprise avec la premire plateforme
unifie pour le Big Data base sur le framework Apache Hadoop. Cloudera fournit aux en-
CLOUDERA FRANCE SRL treprises un lieu unique pour stocker, traiter et analyser leurs informations, tout en crant
de nouveaux moyens de maximiser la valeur des investissements existants et de gnrer
Mail emea-enquiries@cloudera.com davantage de valeur partir de leurs donnes. Pionnier de Hadoop ds 2008, Cloudera
demeure le principal fournisseur et dfenseur du framework Apache dans les entreprises.
Cloudera propose galement des logiciels de gestion dapplications critiques stockage,
accs, gestion, analyse, scurit et recherche de donnes. Cloudera collabore avec plus de
1 000 fournisseurs de matriels, logiciels et services pour rpondre aux objectifs ambitieux
de ses clients.
Dernier point important daprs Romain : la simplification IT. Plus de silot avec des sys-
tmes transactionnels de partout mais un seul Enterprise data Hub. Un seul et mme r-
ceptacle accueille toutes les donnes, qui sont ensuite analyses par des outils simples
et intuitifs selon les besoins de chaque mtier. Cloudera apporte pour sa part lexpertise
fonctionnelle et des supports tels Cloudera Manager.
Chaque secteur et chaque mtier adresse ses propres problmatiques. Dans le retail, la
capacit de positionner le bon produit au bon moment un client donn amliorera la com-
ptitivit. Que ce soit augmenter le CA, limiter les cots, amliorer la qualit de vie, garantir
la scurit, offrir des services innovants Le Big Data rpond prsent.
Romain nous relate alors une anecdote de son dirigeant, Tom Reilly, qui alors quil se trou-
vait au volant de sa voiture en Californie, entendit la radio un alerte tremblement de terre,
dcomptant 8 secondes avant quelles surviennent les secousses. 8 secondes avant ? En
quoi cela est-il utile ? Si un humain a en effet peu de capacits de raction en un temps aus-
si court, les machines, elles, trouvent dans ces quelques secondes un intrt primordial.
Fermer un pont, bloquer des ascenseurs les alertes et raction automatises peuvent
viter de nombreux accidents.
De belles opportunits la cl
Le Big Data offre aux entreprises de diffrents secteurs une formidable opportunit. En
exploitant de nouveaux gisements de donnes de toutes sortes, elles peuvent poser des
questions nouvelles et originales concernant leurs clients et leur activit. Par exemple, les
entreprises utilisent ces donnes pour amliorer lexprience vcue par leurs clients en vue
de les fidliser tout en gnrant une valeur ajoute accrue. Dans le mme temps, en dis-
posant dune vision pertinente et approfondie des activits commerciales, ces entreprises
peuvent identifier les zones dinefficacit qui, une fois traites, participeront potentielle-
ment la rduction des cots dexploitation.
Par rapport aux systmes existants, la plateforme Enterprise Data Hub Edition (EDH) de Clou-
dera prsente des avantages suivants :
> Des archives actives : Un endroit unique pour stocker toutes vos donnes, tous formats
confondus, sans limite de volume, aussi longtemps que vous le souhaitez. Vous pouvez ainsi
rpondre aux exigences de conformit et fournir des donnes sur demande pour satisfaire
aux exigences rglementaires, internes ou externes. Parce que ce lieu est scuris, vous
savez qui voit quoi, et grce aux services de gouvernance et de lignage, vous pouvez suivre
laccs vos donnes, ainsi que leur volution au fil du temps.
> Transformation et traitement : Les charges de travail ETL qui devaient auparavant tre
excutes sur des systmes coteux peuvent migrer vers la plateforme Enterprise Data
Hub o elles pourront tourner trs faible cot, en parallle et beaucoup plus rapidement.
Loptimisation de lemplacement de ces charges de travail et des donnes associes libre
de la capacit sur les systmes analytiques et les entrepts de donnes haut de gamme.
Ce sont par consquent de solides atouts capables de se concentrer sur les applications
critiques prises en charge, telles que les applications OLAP.
> Informatique dcisionnelle exploratoire (Self-service BI): Les utilisateurs veulent souvent
accder des donnes aux fins de reporting, dexploration et danalyse. Dans de nombreux
cas, les systmes dentrepts de donnes de production doivent tre protgs contre un
usage informel afin dtre en mesure dexcuter les traitements analytiques et opration-
nelles quils prennent en charge. Une plateforme EDH permet aux utilisateurs dexplorer
les donnes en toute scurit, en utilisant des outils dinformatique dcisionnelle (BI) inte-
ractifs traditionnels au moyen du langage SQL et de recherches par mot-cl.
> Fonctions analytiques avances : Plusieurs environnements informatiques (computing
frameworks) ddis aux fonctions analytiques, la recherche ou au machine learning, ap-
portent une nouvelle valeur aux sources de donnes, nouvelles et anciennes. Au lieu dexa-
miner des chantillons de donnes ou des instantans correspondant de courtes priodes
de temps, toutes les donnes historiques peuvent tre combines dans des analyses com-
pltes avec une parfaite fidlit. Des donnes tabulaires simples peuvent tre panaches
avec des donnes plus complexes et multi-structures, ce qui tait jusqualors impossible.
GESTION DE LA CHARGE DE TR
AVAIL
Systme de fichier
s NoSQL en ligne
61
www.cloudera.com
CLUB DECISION DSI
COORDONNES Le Club Dcision DSI, premier club franais ddi aux directeurs informatiques
Aujourdhui le Club Dcision DSI runit 1 100 membres directeurs Informatique & Tl-
CLUB DCISION DSI coms de socits du secteur priv et du secteur public dont le parc informatique est sup-
rieur 200 pc. Il rassemble des hommes et des femmes dexprience, anims par la volont
16 Place Vendme de mener des actions qui soutiennent dautres directeurs des systmes dinformation (DSI)
75001 Paris dans la ralisation de leurs projets professionnels.
Le club est administr par Vronique Daval, la prsidente, le vice-prsident, ainsi que par
Tl +33 (0) 1 53 45 28 65 un conseil central compos de neuf directeurs informatiques.
Mail club@decisiondsi.com
CONTACT
Vronique
DAVAL
Prsidente du Club
Le club dispose de son propre rseau social (RSE) sur lequel de nombreuses thmatiques
sont abordes qui permettent aux membres de capitaliser sur lexprience des uns et des
autres. Les ambassadeurs de Club Dcision DSI ont adopt cette solution afin damliorer
la communication entre les membres, de crer des groupes de rflexion sur des thma-
tiques varies, et de diffuser les comptences travers le rseau des membres au niveau
national et europen.
Ce moteur dexprience permet aux socits adhrentes de se servir des retours dexp-
rience des projets IT mis en place par les membres.
Chaque anne les ambassadeurs identifient des thmatiques auprs des membres et dfi-
nissent un programme annuel consultable sur le site internet du Club :
www.club-decisiondsi.com
CSC
79 000 professionnels dans le monde travaillent chez CSC, au service de clients rpartis
dans plus de 70 pays. CSC a ralis un chiffre daffaires de 13 milliards de dollars au cours
de lanne fiscale clture le 30 mars 2014
STORM
R
HADOOP
D3
NOSQL
ERP
EDW
CRM
HCM
PLM
AUDIO/VIDEO
LOGS WEB
FLUX DE CLICS
DONNES DE CAPTEURS
MDIAS SOCIAUX
Big Data PaaS
BIG DATA
DES RSULTATS
TANGIBLES
AVEC LE
IONS
PLICAT
AP
ILIT
MOB
CONNAISSANCE GESTION
CLIENT DES RISQUES
CLOU
CY D
BER
SCU
RIT
OPRATIONS INNOVATION
INTELLIGENTES PRODUIT
65
www.csc.com
DATASTAX
COORDONNES DataStax paule les applications en ligne qui transforment lactivit de plus de 300 clients,
parmi lesquels de nombreuses start-ups et 20 des Fortune 100. DataStax offre une tech-
DATASTAX FRANCE nologie de base de donnes massivement extensible, flexible et constamment disponible,
intgrant une version dApache Cassandra certifie pour la production avec analyses, re-
121 avenue des Champs Elysees, cherches et scurit pour les donnes en temps rel, dans des centres de donnes multi-
Paris, France 75008 ples et dans le cloud. De grandes socits font confiance DataStax pour transformer leur
activit : Adobe, HealthCare Anytime, eBay, ou encore Netflix.
Tl +33 (0)1 72 71 85 85
Fax +33 (0)1 72 71 85 99
Mail svandenberg@datastax.com
CONTACT
Steve
VAN DEN BERG
Les analystes sattendent ce que le march du NoSQL progresse trois fois plus vite que ce-
lui du SQL dans les prochaines annes. Les nouveaux venus dans le Big Data auront donc
coeur de comprendre pourquoi et comment ce type de technologie peut sadapter leur or-
ganisation. Les motivations pour passer au NoSQL sont lies aux besoins de performances,
de monte en charge, de trs haute disponibilit, de distribution gographique, de gestion
de tout type de donnes et de rduction des cots. Il existe cependant des obstacles ind-
niables son adoption, aussi bien techniques que non techniques. Il est important dtudier
ceux-ci en mme temps que les amliorations apportes par lcosystme NoSQL. Par ail-
leurs, il est important de connaitre les cas dutilisation afin de correctement introduire cette
technologie NoSQL dans lentreprise.
Le dploiement dune stratgie NoSQL dans votre entreprise impose donc de bien
comprendre pourquoi et comment les socits utilisant cette technologie ont russi. Il faut
galement dterminer comment votre activit va pouvoir bnficier des spcificits du
NoSQL. Une fois que vous aurez dcid quelle technologie NoSQL est faite pour vous, il vous
faudra encore comprendre les piges viter, les critres de choix selon vos applications et
la bonne stratgie de dploiement.
DataStax propose des logiciels, des services et des stratgies adapts lentreprise pour
vous aider russir votre conversion au NoSQL. Avec sa solution DataStax Enterprise
utilisant Apache Cassandra, scurise et prouve, son assistance 24 heures sur 24, ses
conseils et ses formations dispenss par des experts, DataStax peut vous aider tirer tout
le bnfice du NoSQL tout en facilitant le changement.
Pour en savoir plus sur Apache Cassandra et DataStax et tlcharger les logiciels Cassan-
dra et DataStax Enterprise, consultez le site www.datastax.com ou envoyez un message
info@datastax.com.
67
www.datastax.com
EDIS CONSULTING
COORDONNES EDIS est une structure spcialise dans les systmes daide la dcision et lun des plus
importants acteurs indpendants du march franais de la Business Intelligence.
EDIS CONSULTING - JEMS GROUP
EDIS accompagne ses clients dans la dfinition et le choix des technologies, linstallation de
6 bis rue des Graviers larchitecture BIG DATA ainsi que son intgration au sein de leur systme dinformation (SI).
92 200 Neuillly-sur-Seine
Associ JEMS Group, entreprise ddie aux systmes dinformation, EDIS dveloppe depuis
10 ans des offres de conseil et dintgration de solutions dcisionnelles couvrant toute la
Tl 01 47 89 63 10 chane de valeur jusquau pilotage de la performance des processus et des activits mtier.
Mail mbrancher@edis-consulting.com Avec une politique de partenariat active aux cts des principaux diteurs de Business Intel-
ligence historiques (SAP-BO, IBM, Oracle, MS), et des challengers aux solutions innovantes
et complmentaires (Talend, MAP-R, Tableau...), toutes les quipes EDIS rassembles en
ples dexpertise, maitrisent leurs outils, et sont formes aux meilleures mthodes et pra-
CONTACT tiques de conception, ralisation et de management de projets.
Matthieu LE ple BIG DATA, conoit et met disposition des clients, de tous secteurs dactivits, des
solutions innovantes permettant la collecte, le stockage, lanalyse en temps rel, la diffu-
BRANCHER
sion et la visualisation de donnes structures ou non structures.
Directeur Commercial EDIS propose une mthodologie de metadata enhancement permettant dextraire de la
pertinence et dexplorer de nouveaux axes danalyses dintrts pour les mtiers.
Cr galement en 2002, JEMS Group est LE cabinet en systmes dinformation, fond sur
des valeurs humaines solides pour ses clients et ses consultants.
Renforc en 2012 grce au rapprochement avec EDIS, JEMS possde un savoir-faire et un
savoir-tre qui assurent la russite de chaque projet. JEMS Group compte 260 collabora-
teurs et ralise 24,5 M de chiffre daffaires
BIG DATA
Datawarehouse
DATAvIsuAlIsATIon
DashboarDing
DATAvAlorIsATIon
haDoop
Datalake
Porteurs du Projet
Lun de nos clients, grand acteur du secteur bancaire, souhaite sappuyer sur une innovation
technologique majeure de gestion et de management de donnes (Hadoop) pour centraliser
et partager les donnes internes et externes de ses diffrents mtiers.
Objectifs
Lobjectif du projet est de dvelopper les synergies par un accs et une exploitation plus
transversale du capital dinformations conomiques. En favorisant laccs, lenrichisse-
ment, le partage et le traitement de linformation, le projet doit lui permettre de promouvoir
lchange dinformation entre les diffrents acteurs.
Prsentation
Ce projet majeur vise regrouper dans un espace unifi et mutualis (DATA LAKE reposant
sur le framework Hadoop) des donnes conomiques en provenance de plusieurs sources.
EDIS, spcialiste du traitement de linformation et des infrastructures Big Data, accom-
pagne cette transition technologique et organisationnelle. Nos quipes mnent de front les
chantiers organisationnels, fonctionnels et technologiques.
a. Nature des donnes traites : La plateforme BigData accueille un grand nombre de don-
nes htrognes provenant de diffrents producteurs internes/externes, avec des struc-
tures et formats diffrents et des systmes de codification htrognes.
b. Ressources et mthodologie (comptences humaines, outils techniques, fonctionnement
du traitement de la donne) : EDIS, apporte son avoir faire la mthodologie, ralise le
cadrage et la dfinition des besoins, assure la bonne mise en uvre du projet et participe
la dfinition et la mise en uvre de linfrastructure.
EDIS apporte galement son expertise sur larchitecture Big Data :
- Collecte et stockage de gros volume de donnes dans Hadoop sur des bases de donnes
NoSQL (HBase, MongoDB, Casandra)
- Mise disposition rapide (HDFS, NFS, YARN, MapReduce)
- Analyse, Valorisation & Visualisation (Hive, Pig, Impala, Mahout, Logstash, ElasticSearch,
Shark, Spark, R, Tableau, Kibana etc).
Notre mthodologie pour la constitution de DATALAKE, repose sur un processus dintgra-
tion de donnes qui sont ensuite enrichies en mtadonnes afin de disposer dinformations
contextuelles insres dans un rfrentiel. Cet enrichissement sappuie sur un dictionnaire
de mtadonnes et contribue matrialiser les adhrences entre les catgories de don-
nes issues de sources diffrentes.
Une fois intgres, ces donnes enrichies peuvent tre consultes et exploites par les
utilisateurs :
- Interrogation / recherche du contenu partir dun langage naturel
- Utilisation du moteur de recherche et dindexation ElasticSearch.
Aspect Novateur
Ce projet, par sa taille et ses ambitions est trs certainement lun des plus grands chantiers
BIG DATA men par un acteur Franais de porte internationale. Il doit permettre notre
client sur plusieurs annes de collecter, stocker, intgrer des donnes volumineuses, ht-
rognes et varies dans le but de les analyser et les visualiser en temps rel.
Valorisation observe de la donne
Au-del de rassembler des donnes aussi varies, le projet permet de les enrichir avec
des mtadonnes ad-hoc (tag spcifiques, rfrentiels, synonymes, traductions, mthodo-
logies..) qui facilitent laccs et lanalyse de linformation contenue dans les donnes pro-
duites par les mtiers depuis lIHM pose sur le socle commun.
Etapes venir et dmarche Big Data dans lentreprise
Le projet doit dmontrer la possibilit de rassembler toutes les donnes de lentreprise
dans une bote commune afin de faciliter leur stockage, leur accs, leur partage, leur
analyse et leur visualisation conviviale adapte toutes les familles de mtiers. Elle doit
prouver la mallabilit, et la scalabilit dun tel systme dans le temps. Il ne sagit
pas dune initiative locale mais bien dune mutation complte du systme dinformation du
client.
Autres informations
Nos clients ont les donnes, nous avons la mthodologie et le savoir-faire.
69
www.edis-consulting.com
EKIMETRICS
Tl +33 (0) 1 71 19 49 84
Mail fp@ekimetrics.com
CONTACT
Franois
POITRINE
Ekimetrics est un des rares cabinets de conseil en stratgie spcialis dans lutilisation
Directeur Gnral. Responsable doutils statistiques de pointe permettant loptimisation de la stratgie Marketing et Data de
de la practice BigData grandes entreprises franaises et internationales (CAC 40 / Fortune 500)
Grce notre triple expertise : stratgique, Nous partons de lusage et des besoins
statistique et technologique ; nous sommes business de nos clients pour construire la
mme de livrer des recommandations ac- mthodologie et larchitecture adapte.
tionnables par les CMOs et les CIOs.
Nous avons un partenariat avec la chaire
Nos 70 consultants ont tous un double dconomie des mdias MINES ParisTech.
profil consultant / statisticienData Scien-
tist ( X, Mines, HEC, ENSAE). Nous dlivrons des plans dactions au
bout de 4 mois. Nos recommandations ont
Nous sommes indpendants de tout orga- un impact mesurable sur la productivit
nisme de mdias et dditeurs de logiciels, de votre marketing ds la livraison de nos
ce qui nous permet une grande agilit dans modles.
le choix des outils et des mthodes, ainsi
quune relle impartialit dans nos recom-
mandations .
Eki SocialWeb Lab est un laboratoire de R&D au sein dEkimetrics. Le laboratoire a pour
vocation de comprendre et danalyser les grandes tendances du SocialWeb, en sappuyant
sur lexpertise en Datascience et la comprhension mtier de ses consultants. Grce no-
tamment des algorithmes de classement smantique propritaires, les analystes du So-
cialWeb Lab sont mme de dcrypter le bruit autour de grands vnements culturels et
politiques pour le compte de marques et de grands mdias (Libration, LeLab Europe1,
TheMediaShaker ). Ainsi, durant lanne coule, notre Lab a notamment analys la
Fashion Week, les lections municipales Paris, le festival de Cannes et la Coupe du Monde
de football.
Nous mettons le Big Data au
service de votre stratgie
Notre expertise en Data Science pour vous accompagner dans vos projets Big Data
Durant les deux dernires annes, Ekimetrics a accompagn des leaders de lindustrie des
tlcommunications, de lautomobile et de lnergie dans lexcution de projets BigData.
Nous nous diffrencions par la maitrise de lensemble de la chane de valeur de la data: en
phase de conseil, en phase de data discovery, en phase de data factory et surtout en
phase de valorisation.
Notre philosophie sur les projets Big Data : lapproche PoC Proof of Concept
Dans le Big Data, nous observons un biais consistant construire des systmes pour en-
suite chercher les valoriser (DMP, clusters..), nous faisons le contraire :
Nous avons une approche agile de test et dapprentissage pour mettre jour des
initiatives rellement industrialisables.
Nous partons de lusage mtier pour ensuite construire une architecture sur mesure.
Nous navons pas de contraintes sur la technologie ni sur la mthodologie : nous choisis-
sons la solution la plus adapte en fonction des besoins exprims par nos clients.
71
www.ekimetrics.com
EXALEAD DASSAULT SYSTMES
COORDONNES EXALEAD Dassault Systmes rompt avec 25 ans de tradition dans le dveloppement dapplications,
jusquici centr sur des bases de donnes : sa technologie de recherche et dindexation, couple
EXALEAD DASSAULT SYSTMES des technologies Web, offre un accs unifi et un traitement haute-performance de linformation.
10 place de la Madeleine 75008 PARIS Les organisations ont dsormais besoin de 3 niveaux dexprience de linformation :
Accder agilement et rapidement un grand volume de donnes disperses et htrognes
Croiser, rconcilier, contextualiser les donnes pour crer de nouvelles solutions mtier
et offrir de nouveaux services leurs clients
Tl +33 (0) 1 55 35 26 26 Aller plus loin dans lanalyse pour en extraire encore plus de valeur et transformer leur
entreprise
Fax +33 (0) 1 55 35 26 27
Mail www.3ds.com/fr/contact EXALEAD Dassault Systmes rpond ces dfis et offre des applications personnalises ou
packages, volutives, parfaitement adaptes aux environnements actuels de Big Data et
qui permettent de le transformer en vrais bnfices pour lentreprise.
CONTACT
Axel Les solutions EXALEAD valorisent simplement et agilement vos donnes mtiers pour dcider
mieux et agir vite. Elles adressent trois grandes problmatiques :
BRANGER
Interaction client : EXALEAD OneCall
Digital assets : EXALEAD CloudView / EXALEAD OnePart
Sales Director EXALEAD Machine Data : EXALEAD CloudView
South Europe, Russia & Middle East
EXALEAD propose galement la Web Mining Exprience qui sappuie sur le moteur exalead.com
et offre la puissance de la recherche Web et de lanalyse smantique pour le dveloppement
dapplications partir de donnes pur Web.
www.3ds.com/products/exalead/
@3dsEXALEAD
ANALYTICS pour PARKEON
Porteur du projet
Yves-Marie Pondaven - Chief Technology Officer, Parkeon
Objectifs
Offrir aux villes et oprateurs de parkings un outil de pilotage (ventes, dures) et faciliter
la maintenance des horodateurs Parkeon.
Les dfis taient de rester performant malgr les volumes importants, dtre trs simple
dutilisation et de permettre aux villes ou oprateurs de mieux comprendre les usages
grces de nouveaux tableaux de bords intgrant de la cartographie.
Prsentation
Analytics est un service dvelopp par Parkeon grce la technologie EXALEAD CloudView.
En indexant et analysant plus dun milliard de tickets de stationnement mis par les horo-
dateurs mis en place par une ville ou une communaut urbaine, Parkeon offre un outil de
suivi la fois global et dtaill du parc install des machines pour permettre aux diffrents
services dagir, interagir et ragir pour amliorer le fonctionnement du stationnement dans
une ville.
Les principales fonctionnalits dAnalytics
Horodateurs : Listes - Revenus des terminaux - Vue dtaille par terminal agrgeant de
nombreuses informations (ventes, alarmes, tats de la batterie)
Parking : Evolution des revenus dans le temps, par zone - Evolution en fonction des jours ou des heures
Maintenance : Terminaux avec des problmes de fonctionnements identifis - Terminaux o
des actions prventives sont ncessaires (changement de rouleau de papier)
Transactions : Accs aux transactions par pices ou cartes - Vues plus dtailles possibles
sur les cartes pour filtrer par type de carte (Mastercard)
Malgr les volumes de donnes importants (en centaines de millions pour certaines villes), lou-
til devait rester aussi simple utiliser que les sites grands publics, cest dire sans formation.
EXALEAD apporte son savoir-faire et ses outils correspondants aux meilleures pratiques ergo-
nomiques telles quun set de facettes pour filtrer les donnes, un champ de recherche unique
sur toutes les pages configur pour lutilisation des requtes en langage naturel et trusted
queries ce qui permet aux utilisateurs de prendre en main trs facilement loutil.
La visualisation et lanalyse sont facilites grce des cartes manipulables par zones, des filtres
par priode et date, une cration flexible de rapports, des exports Excel sous format standard
Les temps de rponse, les rsultats clairs et en contexte augmentent lefficacit des diff-
rents utilisateurs de lapplication.
Aspect novateur (mtier/usage)
Lapplication peut tre utilise par nimporte quel utilisateur de lentreprise, quasiment
sans formation. Chaque fonction peut accder facilement aux donnes dont elle a besoin
dans son activit quotidienne.
Analytics offre de grandes performances : une grande scalabilit, une indexation et un traite-
ment puissant des donnes, un temps de rponse adapt aux challenges de la comptition
Les gestionnaires de parcs peuvent ainsi accder et traiter des milliards denregistrements
partir de tout type de sources En quasi temps rel.
Valorisation observe de la donne
Lexigence EXALEAD cest de dlivrer la bonne information, au bon moment, de la faon la
plus intuitive possible. Nimporte quelle fonction de lentreprise, nimporte quel utilisateur
peut naviguer, trouver, analyser et transmettre linformation utile. A linstar de Parkeon, les
organisations amliorent la capitalisation du savoir, lefficacit de leurs quipes, le partage
des connaissances. Parkeon la compris et, grce la technologie CloudView, a transform
des donnes machines basiques en application haute valeur ajoute offrant ainsi ses
clients un service performant pour grer et anticiper son activit de gestion de parcs de
parcmtres. Cest un vrai facteur diffrentiant pour loffre Parkeon.
Etapes venir et dmarche Big Data dans lentreprise
Parkeon va continuer de faire voluer loutil en intgrant toujours plus dinformations et
profiter des nouvelles fonctionnalits autour de la cartographie afin damliorer encore la
solution.
73
www.3ds.com
GFI INFORMATIQUE
GFI INFORMATIQUE Lavnement de lre numrique nous porte considrer autrement le capital information-
nel de tout un chacun. Notre monde volue en permanence sur un rythme de plus en plus
La Porte du Parc - 145 boulevard soutenu et porte des exigences de rentabilit exacerbes par une pression de comptition
Victor Hugo, 93400 Saint-Ouen lchelle mondiale.
Dans tous secteurs dactivits, il nous faut nous radapter en permanence. Laccs la
Tl +33 (0)1 44 04 50 08 lecture de ce que nos donnes expriment nous donne les moyens de se redcouvrir et dagir
de faon nouvelle : prvisions de production de pices dtaches en fonction des com-
Mail alvin.ramgobeen@gfi.fr
portements de conduite et des conditions climatiques pour un mme modle de voiture,
mais aussi assurances diffrencies en fonction de son attitude de conduite sont autant
dexemples parlant qui simmiscent dans notre quotidien.
CONTACT Le Big Data sert avant tout des enjeux business qui doivent tre clarifis en amont lorsque
Alvin lon traite un point dur identifi persistant malgr les investigations traditionnelles (ex. an-
RAMGOBEEN ticiper la fraude lexport) ou en aval lorsquil sagit de dcouvrir des potentiels leviers
dactions dans le cadre dune activit naissante (ex. des compteurs intelligents)
fotolia.com
Gfi Informatique,
architecte ensemblier
de vos projets Big Data
Parce quil nest pas de Mega Structure qui se ressemble, parce que chaque projet
Big Data est lexpression de votre essence et de votre culture, nous sommes vos
cts pour relever ces dfis avec une passion claire et pragmatique.
Gfi Informatique, acteur innovant en systme dinformation, propose une approche autour des thmatiques Big Data contre sens des
normes du secteur. Aprs des travaux conjointement mens auprs dAirbus depuis 2010 portant sur des exprimentations NoSQL dans des
contextes analytiques et prdictifs, Gfi base sa stratgie Big Data en oprant un couplage fort entre le monde des startups et ses comptences
propres. Seul acteur proposer une offre de service la pointe du savoir-faire franais alli lapproche industrielle dun groupe polyvalent en
intgration de systme et en diteur de logiciel, Gfi opre la ralisation de vos programmes Big Data en tant quarchitecte ensemblier.
www.gfi.fr
La posture de larchitecte
ensemblier
Les demandes en Big Data sont extrmement varies : chargement et stockage de donnes
massives, traitement de donnes en temps rel, analyse de donnes textes ou son, labora-
Loffre
tion de moteurs de recommandation, de corrlation, de prdiction analyses rcursives ou de
rseaux (base graph), Data Visualisation spcifique, algorithmie avance, etc. De plus, les de-
Big Data de Gfi
mandes de ralisations Big Data sont souvent couples un existant IT et doivent galement
irriguer les systmes oprationnels et les terminaux de travail quils soient fixes ou mobiles.
Cette diversit en besoins pointus amne Gfi, avec lappui de son cosystme de startups, Conseil outill
se positionner en tant que garant de lassemblage des comptences spcifiques pour en Data Exploration
chaque nature de besoin en Big Data.
Loffre Big Data de Gfi est multi entre et permet de couvrir une grande majorit des at-
tentes du march sur les volets : Aide au choix de
Conseil outill en exploration de la donne qui permet en quelques semaines de faire solutions et Architecture
merger et de quantifier un use case afin de valider sa pertinence face vos enjeux business Big Data
Conseil en aide au choix de solutions et en architecture full & hybride Big Data
Centre de service expriment pour la ralisation de prototypage Big Data
Mise disposition de Framework acclrant le dploiement en environnement de pro-
duction de plateformes Hadoop scurises Centre de service de
Ralisation de projet sur mesure Big Data, en mode agile/Dev Ops, intgrant lexposition
de services sur les terminaux digitaux
prototypage Big Data
Fort du constat march que derrire les termes de Datascientist ou dExpert Hadoop, il est
plus que difficile de trouver le profil comptent chez une seule et mme personne, nous Framework de dploiement
avons dvelopp une approche en quipe pluridisciplinaire.
de production de plateformes
Cette quipe regroupe lensemble des profils spcialiss en Consultants Mtier, Dve-
loppeurs Big Data et Data Analysts, Experts BI & CRM analytique et Consultants Digital et Hadoop scurises
Mobilit.
Afin de sassurer de gagner en scurit et performance, nous allions les comptences de
nos quipes avec lexpertise pointue de startups en Datascience, Data Visualisation, Clus- Ralisation de projet sur
tering Hadoop, Text mining, etc. mesure Big Data avec
exposition de services digitaux
Illustration dindustrialisation dun savoir-faire la pointe
Nous co-dployons, avec notre partenaire ADALTAS, un outil simplifiant et acclrant la
mise de place de clusters Hadoop multitenants scuriss. Issu de prs de 2 ans de travaux
sur les plateformes dun acteur majeur de lnergie en Europe.
Les apports sont multiples et permettent notamment de :
grer plusieurs clusters et mettre disposition des environnements de dveloppement
identiques ceux de production
permettre lajout de nouveaux composants en sinscrivant dans un outil robuste orient DevOps
sintgrer et/ou enrichir lenvironnement scuris de lentreprise de type Kerberos /
OpenLDAP / Active Directory
scuriser tous les composants du cluster (Hive, HBase)
rsumer les tapes de dploiement en une seule commande applicable lchelle du cluster
assurer la haute disponibilit des composants & dautomatiser les sauvegardes
75
www.gfi.fr
HEWLETT-PACKARD
COORDONNES Collecter, agrger et comprendre les informations issues des machines et des humains
requiert une approche et des technologies nouvelles, pour connecter intelligemment des
HEWLETT-PACKARD FRANCE donnes de nature disparate, dune manire comparable au fonctionnement du cerveau
humain faire travailler la technologie et non linverse.
20, Quai du Point du Jour
92100 Boulogne-Billancourt
HP dcline sa stratgie Big Data au travers de HAVEn, plateforme ouverte, intgre mais
modulaire, qui permet nos clients de traiter 100% des informations leur disposition.
Tl 0820 211 211
Hadoop est le support idal pour stocker de trs grands volumes de donnes faible cot.
Mail bigdata.france@hp.com
Autonomy IDOL est un moteur extrmement puissant dindexation et danalyse des infor-
mations humaines : texte, mails, social media, vido, audio, etc.
CONTACT Vertica est une plateforme analytique temps rel (architecture en colonnes) capable din-
Florence grer les donnes et de traiter des requtes complexes 50 1000 fois plus rapidement
LAGET quune base de donnes traditionnelle
Enterprise Security (Arcsight Logger) collecte et analyse en temps rel (1.000.000 dv-
Directrice Big Data, HP France nements par seconde) les logs des applications et des quipements (Badgeuse, Login.).
Lensemble de cette plateforme est supporte par des infrastructures innovantes et spci-
fiquement adaptes au Big Data. Nous sommes en mesure daccompagner nos clients dans
la conception de leurs cas dusage, la mise en uvre, lexploitation ou lexternalisation de
ces solutions.
Scurit, fraude et conformit
Cette banque europenne de12 millions de clients, dispose de prs dun millier dagences
et gre plus de 100 milliards de capitaux en 2013. Elle dtient une distinction pour la qualit
de son centre dappels et de ses plateformes internet, mobiles et rseaux sociaux.
La banque avait comme objectif dacclrer lanalyse des risques de scurit, la rponse
aux requtes et audits du rgulateur, tout en se donnant les moyens damliorer lefficacit
de ses campagnes marketing.
Tous les types de donnes sont capts: applications mtiers, DAB, agences, rseaux sociaux,
logs qualit de service.
Le projet est implment sur la plateforme HAVEn telle que dcrite dans larchitecture
ci-dessous :
Le projet se droule en 3 phases qui rpondent aux 3 enjeux auxquels doit faire face la socit :
Conformit - identifier les accs frauduleux aux comptes clients et rduire drastiquement
le temps de rponse aux requtes de conformit
Scurit - corrler les donnes entre les diffrents systmes pour dcouvrir et mieux
comprendre les potentielles failles de scurit
Gnration de revenus - amliorer la connaissance clients pour optimiser lefficacit des
campagnes marketing et lacquisition de nouveaux clients
Ce projet est innovant dans la diversit des sources et des formats de donnes utiliss.
2500x plus rapide pour rpondre aux requtes complexes daudit, de fraude et de scurit
77
www8.hp.com
IBM FRANCE
COORDONNES IBM est un acteur technologique au service de linnovation et de la transformation des PME,
des groupes internationaux et des administrations. IBM participe crer une plante plus
IBM FRANCE intelligente pour permettre aux organisations quelle sert doptimiser leur positionnement
dans un monde en perptuelle volution.
17 avenue de lEurope
92275 Bois Colombes OFFRE IBM BIG DATA
Big Data permet de comprendre, avec plus de prcision que jamais, comment fonctionne
notre monde afin de produire une plus grande croissance conomique et du progrs social.
Tl +33 (0)1 58 75 00 00 Il constitue une opportunit dobtenir des connaissances sur des types de donnes et de
Mail lucile.hyon@fr.ibm.com contenus nouveaux, afin de rendre les entits plus agiles. Plateforme Big Data IBM IBM
seul propose une plateforme complte qui permet de rsoudre les dfis Big Data qui se
posent aux organisations. Le principal bnfice dune telle plateforme est de tirer parti de
composants pr-intgrs afin de rduire le cot et le temps dimplmentation.
CONTACT
Lucile
HYON-LE GOURRIEREC
www.ibm.com
KEYRUS
Afin datteindre ses objectifs dexcellence dans le domaine de la Data Science et en vue
dassurer lefficience maximale de ses quipes qui seront les garants de la bonne ralisation
des projets quil conduira dans le domaine du Big Data, Keyrus a cr le 15 octobre 2014,
avec lcole polytechnique, Orange et Thales, une Chaire pour former la prochaine gnration
de Data Scientists.
Fort dune capacit unique mobiliser conjointement lexpertise mtier, analytique et technolo-
gique indispensable au succs des ambitions analytiques et Big Data de ses clients, Keyrus rpond
aux dfis daujourdhui par des modalits bien tangibles et pragmatiques, ancres dans la
ralit de lentreprise et cibles sur des projets concrets et accessibles, construisant ainsi
les fondations dun avantage concurrentiel dans la dure.
www.keyrus.fr
81
<<www>>
MICROPOLE
COORDONNES Micropole lance la 1re offre Big Data as a Service destination des entreprises.*
MICROPOLE Loffre Data Science Platform est le rsultat dune troite collaboration entre de grands ac-
teurs du march : Micropole, entreprise internationale de conseil en technologies innovantes,
91-95 rue Carnot spcialise dans les domaines de la Transformation Digitale et du Pilotage de la Performance
92300 Levallois-Perret, France et les entreprises de Cloud Souverain, producteurs de puissance numrique pour les entre-
prises, au travers de leurs solutions dinfrastructure performantes et innovantes.
Indite, loffre de services Data Science Platform est destine dmocratiser le Big Data en
Tl +33 (01) 74 18 74 18 France en mettant disposition de chaque entreprise sa plateforme Big Data sur-mesure.
Data Science Platform intgre un studio de Data Science (qui combine des outils de gestion
Fax +33 (01) 74 18 74 00
de donnes, de statistique, de visualisation et danalyse prdictive), permettant dintgrer, de
Mail info@micropole.com manipuler, danalyser et de prsenter rapidement linformation issue de larges quantits de
donnes.
Spcialistes mtiers, les quipes Micropole accompagnent les quipes clientes tout au long
CONTACT du projet. Leur valeur ajoute et leur vision fonctionnelle adapte au Big Data, leur permettent
Charles de produire des cas dusages mtiers, gages de ROI et gnrateur davantages conomiques
PARAT ou concurrentiels pour lentreprise.
Innovante et comptitive, loffre Data Science Platform rvolutionne les offres traditionnelles
existantes sur le march. Une rponse totalement nouvelle qui va permettre toutes les en-
Directeur recherche & Inovation treprises de tirer parti de la puissance du Big Data.
Loffre Data Science Platform se dploie en 24h au sein de nos infrastructures. Nos quipes
vous accompagnent sur la dfinition de votre application Big Data, et tout au long du projet
dans la prise en main des outils.
Pour des questions de scurit et de transparence, notre offre est propose sur les plate-
formes dployes au sein de Cloud Publics Souverains. Cela signifie que vos donnes sont
protges par la lgislation franaise, et localises sur le territoire national.
*Pour des questions de rversibilit, loffre Data Science Platform est base sur des briques
standards du march et peut donc tre installe sur le site de votre choix (on premise).
Big Data et connaissance client :
projet dans le Retail
Historiquement les donnes prsentes au sein des entreprises sont organises dans des
silos dinformation, le Big Data permet de dcloisonner cette information et de lexposer
diffremment.
Il est alors possible, sur un sujet mtier tel que la connaissance client, de crer une vision
360des donnes, en mettant en corrlation les donnes issues de diffrents canaux (point
de vente, sites internet, centre dappels, etc.), de se construire une vision indite du client
et darriver ainsi visualiser le parcours client omnicanal complet, plus rapidement.
Pour notre client, un acteur reconnu de la distribution spcialise, les objectifs fixs dans
le cadre du projet taient les suivants :
Acclrer lomnicanalit pour accroitre le chiffre daffaires de lenseigne ;
Mieux analyser les comportements web-to-store, dans les deux sens ;
Prendre des dcisions stratgiques, de manire instantane, qui correspondront mieux
aux attentes de leurs clients ;
Dcouvrir des types de comportements pour anticiper leffet churn ;
Proposer de nouveaux services ou produits avant mme que le client
ait conscience de son besoin, gnrer de la valeur pour le client ;
Etre plus ractif dans le traitement de linformation, quelle que soit sa forme ;
Industrialiser la dmarche de rconciliation des donnes.
83
www.micropole.com
NEO TECHNOLOGY
Dcouvrez avec nous ce quapporte la puissance de Neo4j une large varit de clients tels
que Walmart, SFR, Cisco, eBay et Glowbl.
Paris lquipe
Training: neo4j.com/graphacademy
franaise de Neo4j
Neo4j dans votre socit: neo4j.com/brownbag loccasion du salon
Big Data 2015,
Tlcharger Livre: neo4j.com/books stand 404!
Nos clients: neo4j.com/customers
Tlcharger le produit: neo4j.com/tryneo4j
Suivez-nous sur Twitter: @Neo4jFR
Rencontrer la communaut: meetup.com/nd/?keywords=Neo4j
Neo4j
Le leader mondial
des bases de donnes de graphes
LA SOCIETE
Spcialise depuis 2009 dans la livraison rapide dachats raliss sur internet, cest tout
naturellement que la socit londonienne Shutl a t rachete par eBay, qui en a fait sa
plateforme nouvelle gnration pour redfinir le e-commerce en acclrant et en simpli-
fiant la livraison des commandes passes sur Internet ou appareil mobile. eBay limine
ainsi le plus gros obstacle entre vendeurs et acheteurs en ligne en proposant une livraison
le jour mme.
LE DFI
Le service de livraison le jour mme de Shutl sest dvelopp de manire exponentielle
et couvre aujourdhui jusqu 85 % du Royaume-Uni. Sa plateforme de services a d tre
entirement repense afin de prendre en charge lexplosion du volume de donnes et les
nouvelles fonctionnalits. Le problme tait que les jointures MySQL utilises auparavant
ont cr une base de codes trop lente et complexe, proposant des temps de rponses
requtes de 15 minutes pour certaines.
Dveloppeur senior pour eBay, Volker Pacher et son quipe pensaient quen ajoutant une
base de donnes de graphe lAOS et la structure de services, il serait possible de r-
soudre les problmes de performances et dvolutivit.
POURQUOI NEO4j?
Le choix sest port sur Neo4j, considre comme la meilleure solution pour sa flexibilit,
sa vitesse et sa simplicit dutilisation. Fort de son modle de graphe proprits parfai-
tement compatible avec le domaine modlis, et avec sa base de donnes ne ncessitant
pas de schma, Neo4j a simplifi son extensibilit et a permis dacclrer la phase de d-
veloppement.
Cypher a de son ct permis dexprimer les requtes sous une forme trs compacte et
intuitive, ce qui a encore acclr le dveloppement. Lquipe a ainsi pu exploiter le code
existant laide dune bibliothque Ruby pour Neo4j prenant galement en charge Cypher.
Comme aime le dire Volker Pacher : Notre systme fonctionne sur 7 lignes de Cypher .
LES AVANTAGES
Base sur jRuby, Sinatra, MongoDB et Neo4j, la nouvelle plateforme garantit des transac-
tions rapides avec des performances relativement constantes. Par ailleurs, son modle de
donnes permet aux requtes de rester localises lintrieur de leurs portions respectives
du graphe.
Notre solution Neo4j est littralement des milliers de fois plus rapide que la solution
MySQL prcdente, avec des requtes qui ncessitent de 10 100 fois moins de code. Dans
le mme temps, le ct flexible de Neo4j nous a permis dimplmenter lenemble en peine
une anne et il nous permet encore dajouter des fonctionnalits jusquici impossibles, ce
qui permettra laccompagnement du service eBay Now dans ses futurs dveloppements.
Aujourdhui et grce Neo4j, la plateforme Shutl orchestre les livraisons entre les boutiques,
les coursiers et les acheteurs 24 h/24 et 7 j/7. Les envois seffectuent directement depuis les
points de vente. Le service organise la collecte et la livraison des articles selon les prf-
rences des clients, gnralement dans un dlai de 2 heures, ou dans une fentre de livrai-
son dune heure choisie par les clients. Le rsultat : une prestation innovante qui amliore
la qualit de service pour les clients ainsi que la productivit des partenaires revendeurs et
transporteurs. Tous les acteurs sont gagnants : les clients disposent de plus de choix pour
la livraison, les coursiers ne perdent plus de temps attendre et les boutiques peuvent
proposer des services supplmentaires leurs clients sur Internet.
85
www.neo4j.com
PENTAHO
Paris France Pentaho Business Analytics pour exploiter plus rapidement et moindre cot les Big Data grce :
Pentaho Big Data Analytics Center
Une continuit totale depuis laccs aux donnes jusqu la prise de dcision
Un dveloppement visuel et une excution distribue
Tl +33(0)6 38 38 06 33 Une analyse interactive et instantane : aucun codage ni comptences ETL requis
Fax 1 407 517-4575 Instaview : Cette premire application interactive et instantane convertit les donnes en
Mail ebrochard@pentaho.com analyses en trois tapes simples visant rduire considrablement le temps de recherche,
de visualisation et dexploration de larges volumes de donnes complexes et diverses.
CONTACT Pentaho facilite lanalyse des donnes Hadoop
Emmanuel Lutilisation de Pentaho Business Analytics avec Hadoop offre une conception graphique hau-
tement productive associe une analyse et une visualisation des donnes instantanes:
BROCHARD Une plate-forme danalyse Hadoop complte
Une meilleure productivit de lquipe informatique grce la rutilisation des comp-
Responsable France tences existantes ; sans formation particulire pour les informaticiens, analystes dentre-
prise et scientifiques spcialistes des donnes
Une protection contre les risques : fonctionne avec toutes les principales distributions
Hadoop, les bases de donnes NoSQL et les entrepts de donnes traditionnels
Productivit et performance : gain en productivit de dveloppement et en performance
dexcution multipli par 10 ou par 15 par rapport au codage manuel MapReduce
Analyse et visualisation NoSQL : Pentaho supporte nativement les bases de donnes NoSQL
les plus utilises, notamment Apache Cassandra/DataStax, HBase, MongoDB/10gen et
HPCC Systems, et offre une productivit de dveloppement et une performance dexcution
multiplies par 10 ou par 15 par rapport au codage manuel.
Big Data Analytics Center : www.pentahobigdata.com pour en savoir plus sur Pentaho et Big
Data. Pour valuer gratuitement Pentaho Business Analytics: www.pentaho.fr/download.
Par Emmanuel Brochard, responsable de Pentaho en France Mesurer la perception des clients
La plupart des banques mesurent la satisfaction
Les banques de dtail commencent considrer les Big Data comme des actifs promet- des clients un peu au hasard, dune faon dpas-
teurs mme de gnrer de nouveaux flux de revenus. Elles ont besoin de se projeter se. Elles raffolent denqutes o leurs clients
au-del de la vente de produits complmentaires et dexaminer comment lanalyse des Big sont invits complter un formulaire aprs
Data peut rtablir la confiance et amliorer lensemble de lexprience client. chaque transaction. Une faon plus rvlatrice
Plus que jamais, les banques de dtail ont besoin dutiliser la valeur de leurs donnes pour et moins intrusive de connatre la perception des
crer des offres plus concurrentielles. Simultanment, le pouvoir dachat des mnages clients est dassocier moins frquemment des
franais la baisse ou au mieux stable depuis 2007 conduit les consommateurs utiliser enqutes plus dtailles avec des contenus des
des ressources telles que des sites comparatifs de services bancaires ou des logiciels de rseaux sociaux et internet que les clients pu-
gestion pour tre plus actifs dans le suivi de leurs finances. A divers degrs, les banques blient de leur plein gr. Des outils analytiques
commencent intgrer dans une vue unique les dtails de leurs produits phares, tels que pour les Big Data permettent de mixer ces dif-
les comptes dpargne et de crdits immobiliers. Certaines dj inquites pour leur rpu- frentes sources de donnes pour aider les
tation, ont eu peur de pousser plus loin leur intgration par crainte que leurs donnes ne banques concevoir en permanence de meilleurs
schappent des traditionnels silos informatiques et menacent la confidentialit et scurit services.
des donnes. Dautres banques craignent quune plus grande transparence et un apport de Les banques de dtail ont certes un travail consi-
plus dinformations aux clients les incitent aller voir ailleurs. drable accomplir pour btir les infrastructures
et transformer leurs cultures de sorte quelles
Lintgration et lanalyse des Big Data pour concevoir une proposition de valeur commerciale puissent fournir des vues intgres des clients
Soyons clairs, montiser les Big Data ne se limite pas vendre plus facilement des assu- 360 qui serviront de fondation leur propo-
rances additionnelles sur des crdits immobiliers. Il sagit doffrir des services et expriences sition de valeur commerciale. Nanmoins, elles
personnaliss exceptionnels qui conduisent terme une proposition de valeur commer- disposent aussi datouts considrables. Par
ciale, ou de maximiser la valeur totale dun client au travers de toutes ses interactions et tran- exemple, lorsque des clients ont suffisamment
sactions. En dterminant les diffrents besoins des clients et en intgrant cette connaissance confiance en leur banque pour leur permettre de
dans toutes ses transactions, une banque devrait tre capable damliorer le service client et partager des donnes avec leurs commerants
la fidlisation ainsi que daugmenter sa propre profitabilit en optimisant ses prix en fonction prfrs, les donnes pourraient avoir une valeur
de la valeur client. Aussi simple que cela puisse paratre, ceci a chapp aux banques de dtail montaire trs leve. Ou encore, la tendance
pendant des annes parce quelles ont tabli leurs prix sur des suppositions trop gnriques omni-canal des services bancaires qui se dve-
et se sont davantage concentr sur la croissance des revenus plutt que sur lenrichissement loppent via les DAB intelligents, murs dcran
de la valeur client. Contrairement dautres marchs tels que les fournisseurs daccs in- tactiles, applications et kiosques mobiles, sont
ternet qui offrent des services leurs clients, les banques de dtail sont les seules dtenir autant dopportunits de crer des expriences
des donnes concrtes sur ce que leurs clients ont exactement dpens, quand et quelle de services sophistiqus pilots par des donnes
frquence. Elles disposent donc des meilleures donnes pour tablir des profils de clients intgres de haute qualit sont pratiquement
dtaills et concevoir en consquence des produits et services sur mesure. sans limite. Cependant, les banques doivent d-
terminer tout dabord comment montiser leurs
Fournir une vue des clients 360 double usage propres donnes avant mme de penser les
Le service fondamental qui profite la banque de dtail et ses clients est la capacit commercialiser lextrieur !
fournir cette vue intgre 360 degrs du portefeuille complet de chaque client dcrit
prcdemment. Cette vue ncessite de fonctionner de deux faons ! En effet, les banques
devraient avoir cette vue holistique de leurs clients, mais simultanment les clients de-
mandent la mme visibilit de leurs produits et services. Cela implique de pouvoir utiliser
un seul mot de passe pour se connecter et de tout visualiser au travers dun tableau de bord
clair et simple. Les clients prfrant traiter en face face ou par tlphone devraient obte-
nir une exprience intgre similaire sans tre transfrs vers dautres services utilisant
des systmes informatiques non intgrs. Cette vue 360 est le prrequis qui permettra
de montiser les donnes avec plus de profit. Comme voqu plus haut, de nombreuses
banques craignent que leurs donnes schappent de leurs silos scuriss si elles tentent
de les intgrer de nouvelles applications qui amliorent lexprience des clients ou des
responsables de la banque. Cependant, de nouveaux outils dintgration de donnes so-
phistiqus permettent aux banques de mlanger les donnes la source sans devoir les
transfrer au pralable dans une zone de transit . Ces mmes outils permettent gale-
ment dtablir des rgles simples qui garantissent que les donnes soient traites selon les
rgles de gouvernance des donnes locales ou europennes, ce qui liminent virtuellement
les risques de failles de conformit et de scurit.
87
www.pentaho.fr
PIVOTAL
Farid
AADIM
Avec Pivotallabs, venez dvelopper avec nous, votre application mobile dans notre Lab Agile
comme Twitter, Facebook, LinkedIn ou Groupon lon fait avant vous.
Le PaaS est llment essentiel de votre chaine DevOps qui vous permet de rduire la fois
le temps de dveloppement de votre application (de 6 mois 6 semaines daprs Warner
Music) et le temps de vos Oprations (plus de 90% de gain daprs Rakuten). Pivotal Cloud
Foundry est la solution PaaS adapte au monde de lEntreprise grce son cosystme unique
(Fondation Open Source).
A propos de Pivotal :
N dune spin-off de EMC et de Vmware, Pivotal est un diteur de logiciel offrant une ap-
proche technologique moderne afin de permettre aux Entreprises dinnover dans de nou-
veaux business. A lintersection du Cloud, Big Data et du dveloppement Agile, Pivotal per-
met de mieux utiliser ses donnes, dacclrer la cration dapplication et de rduire les
couts, tout en proposant ces Entreprises, la vitesse et la dmultiplication dexcution dont
elles ont besoin pour tre plus comptitifs.
Un oprateur telecom fdre qualit
rseau et qualit client avec Pivotal Big
Data Suite
Composants Description
Spring Spring helps development teams build simple, portable, fast, and flexible JVM-based systems and applications. Spring is
the most popular application development framework for enterprise Java.
RabbitMQ Increase application speed, scalability and reliability by delivering asynchronous messaging to applications. A message
broker for applications.
GemFire Pivotal GemFire is a distributed data management platform designed for many diverse data management situations, but is
especially useful for high-volume, latency-sensitive, mission-critical, transactional systems.
Scale-Out Performance Consistent database operations across globally distributed applications High
availability, resilience, and global scale Powerful developer features Easy administration of distributed nodes
GemFireXD Data Consistency with Cloud Scalability Extreme Performance and Continuous Uptime with Predictable Performance
Data Aware Parallel Function Execution Data Stream with Enterprise Data Store Correlation Relational Technology
Based on Apache Derby Referential Integrity Standards-Compliant Powerful Querying Engine - ANSI Data-Dependent
and Data-Aware Java Stored Procedures
Pivotal HD Simple and Complete Cluster Management: Command Center Big Data + Big Computing: GraphLab on OpenMPI
(Hadoop) Hadoop In the Cloud: Pivotal HD Virtualized by VMware Spring Data: Build Distributed Processing Solutions with Apache
Hadoop
HAWQ A Fast, Proven SQL Database Engine for Hadoop Big Data Analytics Capability and Productivity Parallel Data Flow
Framework Dynamic Pipelining Extension Frameworks with Hbase, Hive, etc PXF Big Data Analytics Capability
and Productivity - MADlib
89
www.pivotal.io/contact
QLIK
COORDONNES Qlik (NASDAQ : QLIK), leader en matire de Data Discovery, propose des solutions intuitives
de visualisation en libre-service et danalyse guide. Environ 33 000 socits sappuient
QLIK sur les solutions de Qlik pour extraire des informations essentielles de sources diverses et
explorer des relations invisibles qui donnent naissance des ides novatrices. Le groupe,
93, avenue Charles de Gaulle dont le sige se trouve aux Etats-Unis, possde des bureaux dans le monde entier et compte
92200 Neuilly-Sur-Seine plus de 1 700 partenaires dans plus de 100 pays. En France, la filiale a t cre en 2007 et
compte parmi ses clients des socits telles que 3M, la Socit Gnrale, le CNRS, Bayer
Healthcare, Meetic, Essilor, RueDuCommerce, le Groupe SEB, etc.
Tl +33 (0) 1 55 62 06 90
Le dploiement de lenvironnement danalyse en libre-service des solutions Qlik ne nces-
Mail infoFR@qlik.com site que quelques jours ou quelques semaines et rpond aux besoins des PME comme des
plus grandes entreprises internationales.
Le modle orient applications des solutions Qlik est compatible avec les solutions de BI
CONTACT existantes et offre une exprience base sur limmersion et la collaboration et intgrant une
Stphane dimension collaborative et mobile.
BRIFFOD
Director Presales
A linverse des solutions de BI traditionnelles, bases sur une approche descendante et des
chemins danalyses prdfinis, les solutions Qlik de Data Discovery donnent toute libert
danalyse lutilisateur mtier, dans le respect dune gouvernance tablie par lIT. La puis-
sance et la richesse de la technologie associative de Qlik apportent :
Des perspectives la porte de tous : Avec les solutions Qlik, tout le monde peut crer
des perspectives partir de ses donnes mtier.
Mobilit : Retrouvez vos applications sur un appareil mobile. Vos donnes mtiers sont
disponibles partout et tout le temps.
Des analyses instantanes : Les solutions Qlik rduisent considrablement les dlais
ncessaires pour gnrer des perspectives et obtenir des rsultats instantans.
Modle inspir des applications grand public : Les solutions Qlik permettent de dvelop-
per et de dployer rapidement des applications simples, ddies un sujet ou gnralistes,
et intuitives qui sont faciles rutiliser.
Rseaux sociaux et collaboration : A tout moment, les utilisateurs peuvent partager des
perspectives et rsultats au sein de lapplication ou par lintermdiaire de plateformes de
collaboration permettant de crer une communaut dutilisateurs.
Les solutions Qlik peuvent tre dployes sur site, en mode cloud, sur un ordinateur por-
table ou un priphrique mobile, pour un seul utilisateur ou bien lchelle de grandes
multinationales.
91
www.qlik.com
SAP FRANCE
COORDONNES Leader des applications dentreprise, SAP (NYSE : SAP) fournit aux entreprises de toutes
tailles et de tous secteurs les moyens logiciels dune meilleure gestion. Du back office la
SAP FRANCE direction, de lentrept la vente, quel que soit le terminal dutilisation (ordinateur, termi-
nal mobile), les applications SAP permettent aux collaborateurs et aux organisations de
Tour SAP - 35 rue dAlsace travailler plus efficacement ensemble et de sappuyer sur des tableaux de bord person-
92300 Levallois-Perret naliss afin de conserver leur avance dans un contexte concurrentiel. Les applications et
services SAP offrent plus de 281 000 clients la possibilit dtre rentable, de sadapter
continuellement et de crotre durablement
Tl 0805 800 023
Mail jean-michel.jurbert@sap.com
Didier Mamma
Nouvelle approche et vision stratgique : comment le Big Data bouleverse notre conomie
CONTACT Didier Mamma est Vice-President of Big Data Sales Emea chez SAP. Fascin par le pouvoir
des donnes, il tient en tudier la porte stratgique et les grands blocs fonctionnels.
Jean-Michel Le Big Data nest certainement pas une nouvelle technologie mais bien un moyen de re-
JURBERT penser son avantage concurrentiel. Comme la remarquablement dcrit Jeremy Rifkin nous
sommes entrs de plain-pied dans la 3e rvolution industrielle, digitale et hyperconnecte.
Directeur de March Solutions SAP On ne peut plus apprhender le prsent avec les paradigmes du pass.
La digitalisation remet galement en cause tous les modles conomiques. Amazon, Net-
HANA, BI - Big Data
flix, Nest, eBay, Apple, Crito, Houzz, Google sont quelques exemples dentreprises qui
sont en train dtablir un nouvel ordre conomique trans-industries.
La question demeure dans la capacit des entreprises capter et traiter cette multitude
dinformations dsormais leur disposition. Comment imaginent-elles lavenir de leur bu-
siness ? Dans ce contexte, la rpartition des dpenses des principaux groupes du CAC40
semble alors dsquilibre. En moyenne, ils ddient 72% de leurs investissements la
maintenance de leur systme dinformation. Dramatiquement, une faible partie des d-
penses est alloue linnovation.
Pour librer une part de cet important budget, lide de SAP est de simplifier lexistant.
Cest lobjectif de SAP HANA. La Plateforme HANA est capable daccueillir et de traiter la
varit des donnes de lentreprise, analytiques ou transactionnelles, structures ou non.
Finie la frntique duplication des donnes et laccroissement du plat de spaghettis
informatique. Parmi les 3V qui dfinissent le Big Data, on se focalise souvent sur le V de
volume, or cest la notion la plus simple grer. La complexit des traitements ou calculs,
la vlocit des oprations suffisent justifier une approche Big Data. Comme le dit Didier,
on peut faire du Big Data avec des gigabites ! . En dfinitive, le Big Data en mouvement
ncessite quatre dimensions. La premire est lie la puissance de calcul pur et rapide. La
seconde, la capacit dextraire linformation cache des donnes. La troisime rendre
intuitive le rsultat des analyses grce la visualisation. Et la dernire dimension est lex-
Didier Mamma pert qui connat la nature de la donne et sa valeur potentielle.
Interviews
Frderic PUCHE rel de laffluence dans son supermarch, lui permettre de relier
cette information aux donnes externes comme la mto et prvoir
Le big data, richesse dapplications et efficacite dutilisation les ractions adaptes. Un modle mathmatique lui dira alors si r-
Frederic Puche est en charge des innovations chez SAP France. Il a organiser ses rayons dune certaine faon lorsque survient la pluie en
organis et anim les prsentations dans le cadre du SAP Big Data priode de forte affluence pourra amliorer son chiffre daffaire.
Tour en Juin dernier. Rendre concret le Big Data et en dmontrer la
richesse des domaines dapplications, cest son objectif. Il nous pr- Il sagit l presque de considrations organisationnelles. Le Port de
sente ici quelques beaux projets mens chez SAP.On associe souvent Hambourg, mondialement connu comme lun des principaux Hub
Big Data volume de donnes et stockage adquat. Mais le Big Data mondiaux, est actuellement confront une problmatique lie sa
cest aussi et surtout la capacit de capter les donnes pertinentes taille. Loptimisation du trafic y est donc primordiale. Il faut anticiper
issues des divers canaux, des mdia sociaux aux objets connects. larrive des bateaux, les golocaliser en temps-rel et intgrer les
HANA, la solution Big Data de SAP, comporte trois volets qui rpondent facteurs externes pour prvoir larrive des camions pour le dchar-
cet objectif. Le premier est une base de donnes en mmoire. Le gement du fret au moment idal.
second, un moteur danalyse smantique et de sentiment puissant,
capable deffectuer des prdictions dynamiques. Le troisime et der- Dernier exemple, la scurit. Le Big Data peut par exemple permettre
nier, un moteur de rgles systmatisant des alertes et apportant agili- de dtecter un mouvement suspect. Dans un aroport, lieu hautement
t lentreprise.Lavantage ? Centraliser lintgralit des donnes sur frquent et stratgique, on peut alors reprer un individu au com-
une mme plateforme, de-dupliquer les intermdiaires et faciliter les portement que le modle considrera comme anormal. Seul, sans t-
process. Avant, on faisait du temps rel, mais chaque Business Unit lphone et immobile pendant plus de 40 minutes, il pourra entrainer
disposait de ses propres donnes et outils. Avec Hana, on fait du Big une alerte au sein du service de scurit. Lintrt est l encore de
Data, et les projets innovants naissent.LExecutive Briefing Center de pouvoir stocker les informations et faire appel lhistorique des don-
SAP en France est justement l pour rendre compte concrtement de nes ou au replay.
ces projets.Dans le sport, un domaine qui a rcemment anim lactua-
lit du Big Data, lintroduction dobjets connects et lanalyse des flux
vido apportent une nouvelle approche. La Mannschaft par exemple,
stocke, dcortique, analyse et construit ses statistiques grce SAP
HANA. Semelles intelligentes, capteurs dacclration, mesure des
pulsations Grce au Wifi, les objets connects apportent au sport
finesse danalyse et ractivit.Le sport, cest aussi un public, dont on
peut observer le comportement via des puces, applications mobiles ou
tickets intelligents, et qui on peut recommader le service ou produit
adquat.
93
www.sap.com
SAS
SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product names are trademarks of their respective companies. 2014 SAS Institute Inc. All rights reserved. S117789US.0114
Macys.com sublime lexprience
client avec les solutions SAS sur
Hadoop
Macys sappuie sur une plateforme Hadoop Cloudera et les solutions danalyse SAS pour
amliorer la performance de ses ventes en ligne.
Les acteurs traditionnels de la grande distribution doivent dsormais tre mme de pro-
poser des services concurrentiels ceux offerts par les purs acteurs du commerce lec-
tronique. Cest ainsi que Macys.com, filiale e-commerce de Macys Inc., icne de la grande
distribution aux tats-Unis, avec plus de 80 ans dexistence et un chiffres daffaires de 20
milliards de dollars, a men un projet destin amliorer lexprience des clients inter-
nautes et accrotre sa profitabilit.
Porteurs du Projet
Ce projet a t dirig par Kerem Tomak, Vice-Prsident Analytics de Macys.com, avec son
quipe danalystes.
Objectifs du projet
Lobjectif tait de mesurer lefficacit des campagnes marketing et les paramtres de navi-
gation sur le site, connatre la Valeur Client, identifier les clients les plus fidles, et adresser
des promotions cibles aux meilleurs dentre eux.
Prsentation du projet
a. Nature des donnes traites
Macys.com exploite des donnes varies : donnes clients, suivi de campagnes de-mailings
de promotion, suivi de navigation, prfrences clients (ce quils aiment et naiment pas).
b. Ressources et mthodologie
Toutes les donnes analyser sont stockes sur une plateforme de donnes Hadoop Cloudera.
Elles sont analyses avec les solutions analytiques de SAS pour segmenter finement les
clients et calculer les scores propres chaque segment.
Lquipe analytique est aussi responsable du reporting destination des quipes marketing
et finance. Lautomatisation du cycle analytique a permis de rduire le temps de production
de ces rapports et dgager du temps pour gnrer plus danalyses et en accrotre la finesse
et la pertinence.
c. Calendrier de dploiement
Ce projet qui a dmarr en 2012 est en production depuis plusieurs mois et en perptuelle am-
lioration : ainsi, Macys.com a pu rduire le taux de dsabonnement ses campagnes marketing
de 20% et accrotre la productivit des analystes. Le gain est estim 500 000 USD par an.
Aspect Novateur
La meilleure segmentation des clients a permis Macys.com doptimiser les campagnes
marketing (en rduire la frquence et le nombre des clients cibls) et accrotre leur effica-
cit (taux de souscription et taux de rponse).
Valorisation observe de la donne
La capacit de comprendre le comportement multicanal des clients est critique pour amliorer
lexprience client et SAS est utilis pour analyser les donnes et crer les modles analytiques
qui valident et adaptent les algorithmes de up et cross sell .
Cette capacit analyser en profondeur et tirer parti des donnes est importante pour sup-
porter la stratgie et le pilotage des volutions du sites Macys.com, commente Kerem Tomak.
Etapes venir et dmarche Big Data dans lentreprise
Lquipe analytique de Macys.com tudie ladoption de solutions doptimisation des pro-
cessus mtier pour maximiser lefficacit des campagnes promotionnelles en amliorant
encore le ciblage et en accroissant la ractivit.
La volont de Macys.com est de gnrer des informations plus prcises et en temps rel sur
les prfrences des clients afin de personnaliser dynamiquement les promotions.
Plusieurs clients SAS utilisent SAS et Hadoop conjointement pour valoriser leurs sources
de donnes (web, log machines, rseaux sociaux, verbatim Service Clients etc.), par
exemple dans des projets damlioration dutilisation de machines industrielles (Predictive
Asset Maintenance), pour fournir des recommandations cibles (produits, contenu) ou pour
accrotre lefficacit des messages publicitaires et des campagnes promotionnelles par un
ciblage prcis.
SAS Institute, socit prive cre en 1976. 70 000 sites clients, dont 2600 en France, plus
de 3 milliards de dollars de CA et 14 000 employs.
95
www.sas.com/france
SCINETIK
SCINETIK
+
IN T ELLIGENCE E-BUSINESS
Hard Soft B.I. Dataviz Conseil Instit.
COORDONNES Scinetik est un cabinet de conseil dont la mission est dassurer pour ses clients, le dveloppe-
ment prenne et rentable de leur activit de commerce connect.
SCINETIK
Notre mission est daccompagner nos clients dans la dfinition et la mise en uvre de
78 rue Taitbout stratgies de dveloppement sur lensemble des drivers de business de la conqute la
75009 Paris fidlisation en passant par la conversion. Pour y parvenir et afin de sassurer de lefficacit
des actions, Scinetik fonde lensemble de ses recommandations sur lanalyse de la donne.
Cette donne vient de multiples sources : le webanalytic, les comportements dachat, les
Tl +33 673 804 708 donnes CRM, des donnes externes...
Mail lively@scinetik.com Scinetik a t cr en raction au manque de pilotage des activits de commerce connect
au sein des retailers. Beaucoup dambitions, peu dexpertise data ou un manque de per-
ception de lenjeu vital de lexploitation de la donne avant mme tout enjeu de branding et
dimage de marque.
CONTACT
Xavire Redonner du sens au business, telle est notre mission.
TALLENT Naturellement cet engagement dans la donne nous a amen dvelopper une expertise
forte en matire de Big Data . Mais pour nous le concept big data nest pas utilis
CEO comme un effet de mode mais comme la conviction profonde que nous sommes arrivs un
nouvel ge du marketing et du business o nous devons rinventer la faon mme dexploi-
ter la donne. Nous nous devons galement daccepter avec enthousiasme le dfi que nous
oppose les varits des sources et types de donnes, lopportunit des open data et tout ceci
en temps rel pour un business toujours plus rapide, une obsolescence des produits et des
promesses relationnelles toujours plus grande
Scinetik travaille pour de grands groupes internationaux dans le domaine du retail, de la
grande consommation, de la mode, du sport.
Le Big Data au service de la
transformation de lentreprise
Le contexte du Client
Aprs plusieurs annes de veille sur la monte du Big data, beaucoup de lecture, la parti-
cipation des confrences, la rencontre avec des entreprises ayant dmarr leur rflexion
big data en France mais surtout ltranger, notre client a dcid de mettre son entreprise
sur le chemin du big data.
Le dfi
Concilier ambition stratgique majeure, pragmatisme conomique et oprationnel. Le Big
Data nest pas prioritairement un sujet technologique mais un sujet stratgique et organi-
sationnel.
Un dfi Stratgique car il va modifier potentiellement le business model de lentreprise, son
offre, son merchandising, son marketing et bien entendu son CRM.
Un dfi organisationnel car beaucoup dentreprises se rfugient derrire le data scientist
, sorte de profil hybride entre data/metier/technique. Or si lensemble des quipes de len-
treprise nest pas partie prenante dans le projet alors les outputs du big data, aussi brillants
soient-ils ne se diffuseront pas dans les diffrentes strates de lentreprise, namneront
pas les hommes et les femmes travailler diffremment en faisant de la donne un atout
majeur au quotidien et dans la dure.
La dmarche
Cration dun groupe de rflexion highlevel, ayant la fois la vision de lentreprise dans
son ensemble et ses particularits et galement le pouvoir de faire bouger les lignes.
Dfinition dune vision stratgique centrale
Dclinaison de cette vision sur les diffrents mtiers de lentreprise
Lide force : Cration de prototypes. Chaque prototype adresse une dimension de la big
data dans une dynamique vertueuse et apprenante
Dfinition de la mthodologie de rcupration et danalyse des donnes internes et ex-
ternes
Dfinition de diffrents scnarios pour la mise en place de linfra, lenjeu ntant pas de
lancer de lourds investissements ds le dmarrage mais de tester plusieurs options pour
permettre les meilleurs choix terme
Lancement des prototypes
Lenjeu de ces prototypes est galement de faire monter en comptence les quipes in-
ternes et de dessiner la future architecture SI de metadonnees.
En fonction des rsultats attendus nous serons mme dutiliser diffrentes techniques
danalyse et de modlisation des donnes en sappuyant sur une quipe de statisticiens
spcialiss Big data.
Le dfi que nous voulons relever est de rpondre de rels besoins mtier en utilisant les
mines dinformations existantes mais peu ou pas exploites et en sappuyant sur de nou-
velles techniques et mthodes danalyse.
Nous sommes convaincus que nos clients peuvent tirer de la valeur des metadonnees. Cest
un vaste domaine dexploration et dexprimentation qui soffre nous.
97
www.scinetik.com
SEMDEE
COORDONNES Quelles proviennent directement de lentreprise (CRM, ECM, CMS, RSE, back office,
E-mails, dossiers textes, voir mme des DATA WAREHOUSE) ou de lextrieur (Sites Inter-
SEMDEE net, Blogs, Forums, Rseaux Sociaux) les donnes non structures sont partout.
Confront ce dluge les Entreprises entendent parler de formidable opportunit , de
15, Rue Jean Baptiste BERLIER gisement de valeur ou de cration de valeur.
75013 PARIS
Comment passer de cette situation davalanche de donnes une cration de valeur ?
Cest cette question que rpond SEMDEE diteur de technologies smantiques au travers
Tl +33 (0)1 55 43 79 60 de son offre SEMDEE SMART DATA FATORY.
La technologie SEMDEE est issue des Sciences Cognitives et de travaux sur la mmoire
Mail contact@semdee.com pisodique. Utilisant les rcents dveloppements en Intelligence Artificielle, SEMDEE met
disposition de ses utilisateurs les ultimes avances dans le domaine de la smantique.
Base sur une approche statistique lutilisation du Machine Learning permet une am-
lioration constante de la prcision et de la pertinence.
CONTACT
Brice Inspir du fonctionnement du cerveau humain lEspace Smantique, au cur de la gamme,
indexe les donnes qui vont tre utilises. Les principales tapes cognitives modlises,
HOARAU
chacune sous forme de module fonctionnel, constituent lensemble de la gamme.
CEO Ces modules sont utilisables de manire autonome pour rpondre un simple besoin tech-
nique (recherche, classification etc) ou dune manire plus complte dans le cadre de la
solution SEMDEE SMART DATA FACTORY .
Solution SEMDEE
SMART DATA FACTORY
SEMDEE SEO PERSOnALiZED
COnTEnT
Web ferm
Web ouvert
Espace
Smantique PREDiCTiVE PROFiLER
Data marehouse E-mails Txt AnALYSER
SEMDEE
CMS
CATEgORiZER
Composants du SI
99
www.semdee.com
SENTELIS
Nous intervenons en tout indpendance vis--vis des diteurs sur ces fondations de lentre-
prise 3.0 (tude opportunit, preuve-de-concept mtier & technologique, industrialisation)
y compris sur les aspects gouvernance et conduite du changement.
Smartfoundations (n.f) :
Cadre de reference Sentelis pour rsoudre
lquation digitale du SI de lentreprise 3.0
Sentelis (n.f) :
Crateur et intgrateur de fondations
stratgiques SI et DSI de lentreprise 3.0
Ralisation en 2 tapes majeures pour scuriser la mise en uvre de la fondation Big Data :
Identification de cas dusage candidats.
Conduite dune preuve-de-concept valeur mtier et architecturale sur une infrastruc-
ture Commodity Hardware et des composants Open Source de lcosystme Hadoop
Ralisation dune preuve de concept sur un usage emblmatique (Vision 360 Client) au
sein dune quipe mixte mtier-SI en mode agile (Utilisateur mtier, Ergonome, Analyste
Donne, Statisticien, Architecte Big Data, Dveloppeur Big Data) incluant :
Lingestion en masse des donnes dans une logique Schema-less/Store-first-Ask-Later
Lingestion de donne unitaire haute vlocit et sans latence
Le traitement en masse des donnes pour corrler lensemble des donnes clients
Lindexation en masse des donnes pour permettre leur exploration
Lexposition de services pour banaliser laccs aux donnes et aux traitements
Calendrier de dploiement
3 mois pour raliser la preuve-de-concept
2 mois pour choisir les composants de la stack Big Data
6 mois pour industrialiser et dployer les premiers usages en production
Aspect Novateur
Modle darchitecture digitale 3.0
Dsilottage des donnes entre les mtiers et des mondes oprationnel et analytique
Amlioration dusages existants (ex : vision 360 Client, Contrat) - Perspective de nouveaux
usages (ex : analyse de la couleur et la teneur de la conversation client, corrlation des flux
comptables) - Capacit dinnovation renforce (Test & Learn, Data Lab)
Valorisation observe de la donne
Le projet permet denvisager une exploitation de toutes les donnes disponibles structures et
non-structures comme jamais auparavant, sans frontire de temps ni despace (ex : analyse
des commentaires clients dans les questionnaires de satisfaction et corrlation avec la notation
; dtection de nouvelle segmentation via des algorithmes danalyses non propritaires).
Etapes venir et dmarche Big Data dans lentreprise
Les tapes venir sont : Industrialisation du socle Big Data (pratiques et solutions) - Mise
en production des premiers usages.
Ces tapes saccompagnent en parallle de la dfinition de loffre de service associe la
fondation Big Data et de lorganisation pour en assurer la prennit et le dploiement dans
lentreprise.
101
www.sentelis.com
SINEQUA
12 rue dAthnes, 75009, Paris Le dfi du Big Data : Plus de 80% de ces donnes sont non structures - des textes en
beaucoup de langues diffrentes. Les professionnels de linformation perdent un temps
considrable regrouper linformation dont ils ont besoin pour accomplir leur travail. La
qualit du service client faiblit, la R&D est freine et les entreprises laissent chapper des
Tl +33 (0)1 70 08 71 71 opportunits lorsque leur personnel est submerg dinformations et incapable de trouver la
bonne information au bon moment.
Fax +33 (0)1 45 26 38 92
Mail pornain@sinequa.com Notre mission :
Offrir un accs en temps rel, personnalisable et scuris aux informations pertinentes
chaque utilisateur dans son contexte mtier.
CONTACT Simplifier la cration dInfoApps (Search-Based Applications) par secteur et par mtier
Xavier
PORNAIN Notre solution :
Une analyse de contenu unique, base sur une analyse smantique brevete (traitement
du langage naturel) et sur une exprience en traitement de donnes structures provenant
VP Sales & Alliances dapplications mtier
Une architecture informatique trs performante et scalable, permettant de grer des
dizaines de milliers dutilisateurs et des milliards de documents en temps-rel
Une intgration scurise et homogne avec plus de 140 sources de donnes
Notre exprience :
Deux dcennies de recherche en matire de traitement du langage naturel
Search et Analyse du Big Data
au service de la Relation Client
AMLIORATION DU SERVICE CLIENT ET RDUCTION DES COTS
Porteurs du projet
Cot client, le projet a t port par la DSI de la Relation Client, avec une implication forte
du Mtier de la Relation Client notamment pour son impact sur lergonomie des Chargs
de Clientle (CC).
Objectifs
Ct business, il sagit avant tout damliorer la satisfaction client; ct informatique, de
diminuer les cots lis au fonctionnement du centre de contacts et de ses quelques 250
applications; enfin, laccs unifi linformation depuis une seule application permet de
rduire drastiquement la dure de formation et de monte en comptence, et damliorer
lergonomie des CC.
a. Amliorer la satisfaction client
La nouvelle interface de travail des CC leur permet de rpondre directement 80% des re-
qutes client. Libr dune navigation chronophage entre plusieurs applications (plus de 30
dans certains cas), le CC peut traiter la demande du client plus efficacement.
b. Rduire le cot de fonctionnement et gagner en performance
Le dcouplage entre la lecture des donnes et laccs aux applications back-office amliore
les performances et rduit les temps de rponse, mme durant les piques dactivit.
Le systme dinformation gagne en agilit puisque des applications (Info Apps) peuvent tre
dveloppes rapidement afin de sadapter aux volutions du business.
c. Diminuer le besoin en formation et amliorer lergonomie du CC
La complexit du Back-Office existant (ERP, CRM, etc.) sefface devant la nouvelle interface
du CC rduisant le besoin de connaissance des outils Back Office.
Prsentation
a. Nature des donnes traites
Il sagit de donnes structures venant dERP, du CRM, dapplications mtiers spcifiques
mais aussi de contenus non-structurs comme des contrats, des factures ou des emails.
b. Ressources et Mthodologie
Le projet a t conu en mthode agile avec les utilisateurs finaux.
c. Calendrier de dploiement
Le pilote a t ralis en 2 mois et la mise en production en 9 mois.
Aspect Novateur
Fdrer de la donne structure et non-structure afin de crer une vue 360 client en
temps-rel pour des milliers de CC est lun des cas dusage du Search et de lAnalyse de
donne Big Data les plus innovants raliss aujourdhui. Le Search joue dsormais un
rle dterminant au cur de processus mtiers stratgiques. Offrant un vritable levier de
comptitivit, il ouvre la voie des innovations qui nauraient pu voir le jour dans des archi-
tectures informatiques classiques .
En peine neuf mois, le projet a t dploy auprs de 10 000 CC. Le ROI en satisfaction
client et en temps gagn par appel sest fait sentir trs rapidement aprs le dploiement.
Valorisation Observe de la donne
La mise en place du nouvel accueil client permet de rduire de prs de 20% la dure
moyenne des appels donnant ainsi aux 10 000 CC la capacit de traiter environ 40.0 000 ap-
pels supplmentaires par jour, et daugmenter lARPU (Average Revenue Per User) grce
une meilleure connaissance du Client (permettant de proposer les offres les plus adaptes).
Etapes venir et dmarche Big Data dans lentreprise
A lavenir, encore plus de sources de donnes pourront tre indexes, y compris des donnes
non structures provenant par exemple des rseaux sociaux (Data-profiling, Data-scoring).
103
www.sinequa.com
SPLUNK
COORDONNES Splunk Enterprise est la plateforme leader de lintelligence oprationnelle en temps rel.
Elle offre un moyen simple, rapide et scuris dexplorer, analyser et visualiser les flux
SPLUNK massifs de donnes gnrs par vos systmes informatiques et votre infrastructure tech-
nologique, quelle soit physique, virtuelle ou dans le Cloud.
Tour Ariane 5 place de la Pyramide
Splunk Enterprise offre :
92088 La Dfense Cedex
De puissantes capacits danalyse accessibles tous des vitesses extraordinaires
Tl 01 55 68 12 61 Une exprience utilisateur entirement repense
Un environnement de dveloppement enrichi permettant de prolonger facilement la
Mail emea_france@splunk.com plateforme
Splunk Enterprise 6.1 est notre dernire version et offre des fonctionnalits conues pour
amliorer la manire dont vous analysez vos donnes et interagissez avec elles, tout en
CONTACT proposant une disponibilit continue de votre dploiement distribu de Splunk Enterprise.
Pierre
GOYENEIX Recueillez et indexez les donnes machines de toutes les sources ou presque en temps
rel. Explorez, surveillez, analysez et visualiser vos donnes pour obtenir de nouveaux ren-
Directeur Commercial EMEA South seignements. Indexez toutes vos informations pour bnficier dune meilleure visibilit et
renforcer vos capacits dinvestigation et de dpannage. Travaillez plus intelligemment en
partageant des recherches entre quipes et en accumulant des connaissances propres
votre organisation. Crez des rapports cibls pour identifier des tendances ou rpondre
des contrles de conformit. Composez des tableaux de bord interactifs pour surveiller les
incidents de scurit, les niveaux de services et autres indicateurs cls de performance.
Analysez les transactions des utilisateurs, le comportement des clients, celui des ma-
chines, les menaces de scurit et les activits frauduleuses, le tout en temps rel.Indexez
toutes les donnes
T:190 mm
SECTEUR
Voyages (agence de voyages en ligne)
CAS DUTILISATION SPLUNK
Gestion des applications
Intelligence numrique
Intelligence oprationnelle
RSULTATS
Meilleure exprience utilisateur avec une rduction de 82 % des temps de rponse des pages.
Amlioration du rfrencement naturel par lidentification et la rparation ou la suppres-
sion des liens non trouvs. Identification en temps rel des divergences de configuration,
permettant dviter des pertes de recettes. Relation proactive avec les oprateurs pour
rectifier les erreurs humaines du processus.
SOURCES DE DONNES
Logs du proxy inverse Varnish Logs applicatifs Tomca
Dfis
Karavel attache une grande importance la haute qualit de service offerte ses clients,
mais souffrait dun manque de visibilit dtaille sur son architecture informatique. Des
outils de surveillance taient bien utiliss, mais ils ne fournissaient pas une vision suffi-
samment prcise. Karavel pouvait par exemple connatre le temps de rponse moyen des
pages principales dun site donn, mais pas la distribution dtaille des temps de rponse
; il ntait donc pas possible de savoir combien dutilisateurs recevaient un service infrieur
aux accords internes sur les niveaux de service, ni didentifier prventivement les situations
o ceux-ci taient sur le point dtre enfreints. Ce manque de visibilit avait en outre des
consquences sur le processus de rservation en ligne, car Karavel ntait pas en mesure
de dtecter certains problmes : par exemple, des divergences entre les configurations
dun produit cr par loprateur, import sur la plateforme de Karavel et offert aux clients
via le site web. Certaines erreurs rendaient impossible la finalisation de lachat par le client.
Intervention de Splunk
Karavel a choisi Splunk Enterprise pour garantir la qualit de ses services de rservation en
ligne, mieux comprendre et amliorer les temps de rponses de ses pages web, et assurer
le respect de ses accords sur les niveaux de service. Les logiciels Splunk sont maintenant
utiliss tant par lquipe technique que par lquipe commerciale de Karavel, et servent
amliorer le service offert aux clients par toutes les marques de lentreprise. Lquipe tech-
nique surveille en temps rel le processus de rservation en ligne, et utilise des alertes auto-
matiques qui se dclenchent lorsque quun nombre anormalement lev derreurs se produit.
Elle examine dautre part chaque semaine les rapports de Splunk exposant les temps de
rponse des pages web. Lquipe commerciale observe elle aussi les rapports de Splunk, pour
identifier et rectifier prventivement tout problme. En outre, les tableaux de bord de Splunk
fournissent lquipe de direction des indices hebdomadaires de performances.
Karavel envoie Splunk Enterprise les logs de son proxy inverse Varnish et de Tomcat. Un
relayeur envoie ces donnes deux indexeurs ayant une tte de recherche unique. Kara-
vel utilise les logiciels Splunk conjointement avec AppDynamics, effectuant les recherches
avec Splunk et utilisant ensuite AppDynamics pour des investigations en temps rel. Kara-
vel a aussi construit des applications Splunk ddies : une pour le processus de rservation
en ligne et une pour laccord de service de chaque site web.
Progrs
Une meilleure vision relative aux accords sur les niveaux de service des sites web a diminu
les temps de rponse de 82 % Identification en temps rel des divergences de configuration
des rservations en ligne Optimisation du rfrencement naturel quipe commerciale
Nous proposons aujourdhui une meilleure exprience de navigation sur notre catalogue
de sites de voyages, avec des temps de rponse rduits et une identification immdiate de
divergences de configuration potentiellement coteuses.
Architecte technique
Karavel
105
www.splunk.com
SYNCSORT
COORDONNES Fort de 40 ans dinnovation, dexpertise et de russite, Syncsort aide les entreprises travers
le monde intgrer les Big Data plus intelligemment.
SYNCSORT
Syncsort propose des solutions logicielles fiables, performantes, fonctionnant aussi bien
Tour Ege - La Dfense sur Hadoop que sur le mainframe. Nous aidons nos clients, partout dans le monde collec-
17, avenue de lArche ter, traiter et distribuer plus de donnes, en moins de temps, avec moins de ressources et
en optimisant les cots. Une majorit des entreprises du Top 100 sont clients de Syncsort
92671 Courbevoie Cedex - France et nos solutions sont utilises dans plus de 85 pays pour off loader des applications lega-
Tl +33 (0)1 46 67 46 10 cy, onreuses et inefficaces, acclrer les traitements dans votre data warehouse et votre
mainframe et optimiser lintgration de vos donnes dans le cloud.
Mail syncsortsamkt@syncsort.com
En 1968, sept ingnieurs et mathmaticiens se sont runis pour rduire les cots et la com-
plexit lis aux donnes et leur traitement. En perfectionnant une srie dalgorithmes qui
rationalisrent le tri mainframe, utilisrent moins de ressources, sadaptrent selon des
variables denvironnement spcifiques et assurrent une scalabilit pour faire face des
CONTACT volumes de donnes toujours croissants, ils changrent jamais la manire dont les entre-
Florence prises pouvaient envisager lconomie des donnes et ils fondrent Syncsort.
RABUEL
Aujourdhui, avec des milliers de dploiements travers le monde sur toutes les plates-
formes majeures dont le mainframe, Syncsort fournit des solutions dintgration Big Data
Regional Director aux entreprises grant dnormes quantits de donnes tout au long du Big Data Conti-
nuum, une manire plus ingnieuse de collecter, traiter une avalanche de donnes toujours
croissantes..
Le sige social de Syncsort est situ au Nord Est du New Jersey. Syncsort est prsent
linternational avec des filiales au Royaume-Uni, en France et en Allemagne, avec un centre
de support aux Pays-Bas et des distributeurs. Syncsort dispose dun rseau international
de partenaires, revendeurs et distributeurs qui incluent ses solutions comme composants
de leur offre informatique.
Syncsort est cette entreprise unique qui a brillamment fait voluer son
business model de lre du mainframe celui dHadoop. En capitalisant
sur cette exprience, Syncsort a dvelopp des solutions sur mesure
pour permettre aux entreprises doptimiser leurs charges de travail
travers lensemble de leur architecture de donnes. Elles ralisent ainsi
des conomies et allgent la charge sur le datawarehouse et le main-
frame, ce qui acclre les traitements par ceux-ci.
SILQ. Le premier et unique outil conu pour aider les clients com-
prendre des tches complexes dintgration de donnes SQL et les Lonne Jaffe,
offloader du datawarehouse vers Hadoop.
PDG
Le moteur de tri et ETL le plus rapide pour mainframe, Hadoop et
Linux/Unix/Windows.
Lutilisation des puissantes capacits de tri de Syncsort DMX h nont pas rendues nces-
saires lacquisition de hardware supplmentaire.
107
www.syncsort.com
TABLEAU SOFTWARE
COORDONNES Connectez-vous nimporte quelle source de donnes, quelle que soit son type ou sa taille.
Analysez et crez des tableaux de bords et partagez-les en quelques clics. Tout cela en
TABLEAU SOFTWARE respectant votre architecture de donnes et vos protocoles de scurit.
Rencontrez le nouveau visage des solutions dcisionnelles : Tableau Software. Tableau aide
Blue Fin Building les utilisateurs visualiser et comprendre leurs donnes. Quel que soit la source, le format
110 Southwark Street ou le sujet de vos donnes, le logiciel prim de Tableau vous permet dobtenir rapidement des
analyses pousses et visuelles. Le rsultat ? Chacun peut obtenir facilement des rponses,
SE1 0SU London - ROYAUME-UNI sans notion de programmation. Des tableaux de bords pour excutifs aux rapports ponctuels,
Tl +33 9 70 44 93 95 Tableau vous permets de partager vos analyses interactives en quelques clics. Plus de 21
000 entreprises et organisations, incluant certaines des plus importantes au monde, font
Mail jsigonney@tableausoftware.com confiance Tableau pour obtenir rapidement des rsultats, au bureau ou en dplacement.
Laissez de ct les solutions de dcision traditionnelles et optez pour la plus facile dutilisa-
tion, la plus rapide et la plus agile des solutions dcisionnelles du march. Avec tableau, les
employs obtiennent ce quils dsirent et votre service informatique conomise du temps
CONTACT et de largent.
Julien Tableau Software concentre son offre autour de trois produits principaux pour les entre-
prises : Tableau Desktop, Tableau Server et Tableau Online. Nos quipes ventes et marke-
SIGONNEY
ting France sont votre disposition pour rpondre vos questions et vous aider choisir la
solution la mieux adapte vos besoins comme elles lont fait pour dautres clients presti-
Sales Area Manager gieux tels que : La Croix Rouge, Unilever, BNP Paribas, Nokia ou encore eBay.
Rpondez aux questions aussi vite quelles vous viennent grce Tableau Desktop
Tableau Desktop utilise une technologie innovante de luniversit de Stanford qui vous per-
met de glisser-dposer des donnes pour les analyser. Vous pouvez accder aux donnes,
visualiser et crer facilement des tableaux de bord interactifs que vous pouvez ensuite par-
tager en quelques clics. Et tout cela sans rien programmer !
Tableau se connecte en direct la majorit des bases de donnes et feuilles de calculs
et offre galement une architecture en mmoire rvolutionnaire qui augmente la rapidit
des analyses. Quiconque sachant se servir dExcel peut apprendre rapidement utiliser
Tableau.
Prsentation du projet
Le gant bancaire franais a mis sur Tableau pour recueillir et analyser ses donnes en
seulement quelques minutes. La division BNP Paribas du Sud-Ouest de la France dispose
maintenant de la capacit de visualiser les tendances de gocodage utilises dans le cadre
des campagnes commerciales et marketing de la banque. Et laperu partag et dtaill de
la performance de 2 000 agences travers la F contribue renforcer la comptitivit.
BNP Paribas recherche constamment des manires de diffrencier ses services en offrant
une exprience plus localise. Tableau permet la banque dtudier la localisation des dis-
tributeurs automatiques de billets des concurrents et didentifier les sites potentiels pour
de nouveaux distributeurs : Comparer la localisation de nos clients avec la disponibilit du
rseau existant de distributeurs automatiques de billets nous permet de cibler de nouveaux
emplacements de distributeurs , dclare Pierre Thebault.
Malgr lexpansion des services bancaires en ligne, les franais restent attaches aux
agences physiques. Tableau reprsente la source primaire pour les rapports sur la perfor-
mance des 2 000 agences BNP Paribas franaise. Directeurs et responsables partagent un
aperu dtaill de la performance de chacune des agences : chiffre daffaires, rentabilit,
personnel, adoption des services bancaires en ligne de la part des clients, etc. Laccs
rapide des donnes fiables, grce Tableau, se traduit par une prise de dcision vive
et fiable concernant les agences , affirme Pierre Thebault. Il poursuit, Avant Tableau,
nous utilisions des feuilles de calcul et une base de donnes Access. Cela nous prenait des
heures, des semaines, voire des mois, pour trouver les donnes correctes et les rponses
dont nous avions besoin. Dsormais, grce Tableau, lintgration homogne et la simplici-
t dutilisation signifient que nous obtenons les rponses en quelques minutes. Cela rend-il
la banque plus perspicace ? Oui, sans lombre dun doute.
Prochaines tapes
La majeure partie de linspiration pour ce programme couronn de succs appartient
Mydral, le partenaire dexcution de BNP Paribas. La vision, la perspicacit et lexprience
de lquipe de Mydral ont contribu au lancement de Tableau en quelques jours. Mydral a
galement fourni BNP Paribas trois jours de formation et de transfert des connaissances
afin de garantir que lquipe soit oprationnelle presque immdiatement.
Ce projet attire dsormais lattention dautres services de la banque. BNP Paribas dploie
actuellement Tableau sur les sites rgionaux de Paris et Nantes dans le cadre dun projet de
segmentation de la clientle. Ces donnes sont utilises pour comprendre les tendances,
concevoir de nouvelles campagnes, et maximiser la valeur de BNP Paribas tire des don-
nes marketing.
109
www.tableausoftware.com
TIBCO
COORDONNES TIBCO Software Inc. (NASDAQ : TIBX) est un leader mondial dans le domaine des logiciels
dinfrastructure et dcisionnels. Quil sagisse doptimisation des stocks, de vente croise
TIBCO JASPERSOFT ou de prvention des crises, TIBCO offre un concept unique nomm Two-Second Advan-
tage, autrement dit la possibilit de capturer la bonne information au bon moment et
25, rue de Balzac 75008 Paris de ragir en fonction de cette information plus vite que la concurrence. Grce son vaste
France ventail de produits et services novateurs, TIBCO est un partenaire technologique strat-
gique plbiscit par les entreprises dans le monde entier. Pour en savoir plus sur TIBCO,
rendez-vous sur www.tibco.com.
Tl + 33 (0)1 44 51 70 90
TIBCO, Jaspersoft, Two-Second Advantage et TIBCO Software sont des marques commer-
Mail gcarbonnel@jaspersoft.com ciales ou des marques dposes de TIBCO Software Inc. et/ou de ses filiales aux Etats-Unis
et/ou dans dautres pays. Amazon Web Services, AWS et Redshift sont des marques com-
merciales dAmazon.com, Inc. ou de ses filiales aux Etats-Unis et/ou dans dautres pays.
MongoDB est une marque commerciale de MongoDB, Inc. Tous les autres noms de produits,
CONTACT dentreprises et de marques mentionns dans ce document appartiennent leur propri-
Lela taire respectif et ne sont mentionns qu des fins didentification.
BOUTALEB BROUSSE
YOUR ACCESS TO
FAST DATA
BEGINS NOW.
111
www.tibco.com
TALEND
COORDONNES Les solutions dintgration de Talend aident les entreprises tirer le meilleur parti de leurs
donnes. A travers le support natif des plates-formes modernes de Big Data, Talend rduit
TALEND la complexit de lintgration, tout en permettant aux dpartements informatiques de r-
pondre plus rapidement aux besoins mtiers, le tout pour un cot prvisible. Reposant sur
9 rue Pags 92150 Suresnes des technologies open source, les solutions hautement volutives de Talend rpondent
tous les besoins dintgration, actuels et mergents.
Prvisibilit
Le modle de prix des souscriptions sans conteneur dexcution permet de faire voluer
de manire prvisible les donnes et les projets, sans avoir faire voluer le cot de lin-
tgration. La conformit aux standards Java, Eclipse et Big Data rduit le temps de dve-
loppement et de maintenance des projets. Ainsi, les cots oprationnels sont galement
prvisibles.
A lpreuve du futur
Comme laventure Big Data passe des tests lanalytique et au temps rel/aux cas opra-
tionnels, Talend livre une plateforme dintgration unique, complte et unifie rpondant
tous les besoins daujourdhui et de demain.
Talend facilite
lintgration des CONTACTEZ-NOUS:
info@talend.com
113
http://fr.talend.com
TERADATA FRANCE
COORDONNES Teradata helps companies get more value from data than any other company. Our big data
analytic solutions, integrated marketing applications, and team of experts can help your
TERADATA FRANCE company gain a sustainable competitive advantage with data. Teradata helps organizations
leverage all of their data so they can know more about their customers and business and
Antony Parc I : 2-6 place du Gnral do more of whats really important. With more than 10,000 professionals in 43 countries,
de Gaulle - 92160 Antony Teradata empowers organizations to become data-driven businesses that exploit data for
insight and value. More than 2,500 customers worldwide span industries including auto-
motive and industrial; communications; consumer goods; e-commerce; financial services;
Tl +33 (0)1 81 89 15 00 government; healthcare and life sciences; hospitality and gaming; insurance; manufactu-
ring; media and entertainment; oil and gas; retail; transportation, distribution, and logistics;
Mail severine.vigneron@teradata.com travel; and utilities.
A future-focused company, Teradata has driven innovation for thirty-five years. Teradatas
workload-specific platforms integrate an organizations data into a unified view of the bu-
CONTACT siness. Our database software includes the unparalleled Teradata Database, and, for big
Sverine data analytics, the Teradata Aster Discovery Platform and Hadoop Portfolio. The unique
Teradata Unified Data Architecture helps customers discover and operationalize insights
VIGNERON
by integrating multiple technologies, including Hadoop, into a robust, hybrid architecture.
Teradatas marketing and analytic applicationsavailable on premise or in the cloud leve-
Marketing Manager Teradata France rage data to improve marketing effectiveness, determine profitability, and forecast demand.
These powerful solutions, along with years of hands-on experience working with the worlds
leading enterprises, enable customers to maximize the value of their data and serve their
customers better. Teradata is recognized for technological excellence, sustainability, corpo-
rate social responsibility, ethics, and business value.
When youre able to collect, unify, and analyse all of the data that surrounds your
business, you can uncover the insights that matter most. It could be an insight
that changes the way one customer sees your company or how your company
sees the world. Learn how our analytic platforms, applications, and services can
help you know more so you can do more at Teradata.com/DataDriven.
Big Data is real and its growing at mind-dazzling speed How Companies are Innovating with Big Data
Big Data refers to the vast spectrum of digital information arising Cardinal Health : Cardinal Health has used data to optimize the sup-
from an increasing variety of data sources which come in wide ran- ply chain ensuring that the complicated array of raw materials that
ging and ever-expanding data formats. are essential for high quality healthcare arrive in good condition,
This includes structured data derived from common business sys- when the patients need them.
tems, and unstructured data, or more correctly multi-structured McCain Foods : McCain Foods is a global food giant, with great piz-
data, in its diverse variations from weblogs and sensor data, to data zas, vegetables, appetizers and desserts. And theyve transformed
in social networks, text documents, or all forms of digital images their culture with data. McCain has taken more than 22,000 reports
and video content. And the list goes on Teradatas view on Big Data and 3,000 personal reporting systems and put the data in one place.
however goes even a step further. We took 30,000 versions of the truth, and brought it down to one
version of the truth.
We believe, fundamentally, that ALL data has relevancy for compa- Verizon Wireless : How does the biggest wireless carrier in the
nies to make better, more informed business decisions. Identifying United States keep their customers happy? Provide the best
the valuable information amongst the irrelevant data is not always network with the best customer experience and listen. How does
obvious without initial analysis, and often what has no value to one Verizon Wireless listen? With an Unified Data Architecture.
purpose is critical to another. As a result it becomes more expensive Barnes and Noble : Taking data from more than 1,300 stores and one
to decide what is valuable than to retain all data and consider later of the largest loyalty programs in the US, Barnes and Noble com-
how it can be used to create value this is the data lake concept. bines it with data from their e-commerce site. Using data analytics,
Barnes and Noble knows exactly who their customers are, and what
With increasing scope for analytics, and recognition of the competi- they want to buy or read next.
tive advantage of being data-driven, it becomes ever more important
for companies to find efficient processes and supporting technolo- Discover More Insights and Outcomes through our customer data
gies to derive business value from the data lake in the timeliest driven business Success Stories:
possible manner. This is exactly where Teradata comes in. http://blogs.teradata.com/customers/ or visit Teradata.com
Teradata combines the most advanced, highly scalable Big Data Contact us to learn more on Teradata, solutions and our unique
technologies under one umbrella in an integrated manner. We call approach to Big Data.
this the Unified Data Architecture, blending in with what leading
analyst firm Gartner refers to as the Logical Data Warehouse.
With the Teradata Database, Hadoop, and the Aster Discovery Plat-
form the Teradata Unified Data Architecture provides organisations
with a rich set of capabilities to support them in their pursuit of deri-
ving value from analytics based on ALL the data.
Teradata Applications
115
www.teradata.com
VISEO
COORDONNES En sappuyant sur ses expertises dans les domaines du digital, des technologies, des pro-
cess et de la data, VISEO vous accompagne dans vos chantiers de transformation et vous
VISEO aide faire merger de nouvelles ides, de nouvelles offres, de nouveaux modes de colla-
boration, de nouvelles manires de produire et de vendre.
38 rue de Ponthieu 75008 Paris
Avec 1 100 collaborateurs rpartis sur quatre continents et un chiffre daffaires suprieur
110 millions deuros, VISEO vous propose une alternative aux intgrateurs, agences et
cabinets de conseil, en imposant une approche unique, souple, innovante et structurante.
Tl 01 56 56 71 00 VISEO vous apporte ainsi une rponse globale et vous aide mettre en uvre des projets
complexes pour faire face aux enjeux numriques qui impactent les systmes dinforma-
Mail contact@viseo.com tion, les mtiers ou les organisations
Adresser aujourdhui les enjeux structurants de demain : VISEO mobilise lensemble de ses
expertises pour vous permettre de comprendre et anticiper les sujets cls dans lvolution
de vos activits.
CONTACT
Yves VISEO et le BIG DATA : et si nous parlions conseil plutt que Technologie ?
COINTRELLE
Le Big Data offre un nouveau regard sur les donnes en ouvrant de nouveaux moyens
pour les saisir, les stocker, les grer, les traiter et les analyser.
Directeur de la stratgie et Grce la combinaison unique de lensemble de ses comptences Big Data (Conseil,
du dveloppement Business Intelligence Data Scientist, Business Intelligence), VISEO accompagne ses clients autour de 3 grands axes :
Dcouvrir le potentiel et identifier les cas dusage pertinents crateurs de valeur
Tester par la mise en place de POC
Dployer & Exploiter les donnes
Accompagner les volutions organisationnelles
Russir son projet Big Data :
la mthode
Les motivations qui amnent une entreprise initier un projet Big Data sont souvent mul-
tiples. Une direction gnrale soucieuse de sassurer que le capital informationnel de len-
treprise recle de la valeur inexploite ; une dmarche exploratoire conscutive une prise
de conscience de possession dimportants gisements de donnes en sommeil et souvent
en silo ou encore des directions mtiers soucieuses damliorer leurs connaissances et
leurs capacits danalyse et de prise de dcision ; souhaitant investiguer de nouvelles pistes
doptimisations, damlioration de productivit ou de profitabilit.
Quelle quen soit lorigine, la dmarche associe la mise en uvre dun projet Big Data est
seme dembuches et dchecs. Les donnes ne sont pas toujours disponibles, exhaustives
ou nont pas toujours la qualit espre pour tayer les analyses souhaites. Les budgets
mettre en regard des objectifs atteindre ne sont pas toujours couverts par les gains
procurs par la mise en uvre des systmes.
Pour viter ces cueils, valider les modles ou les ROI, sans prir ou engloutir des budgets
pharaoniques, VISEO a dvelopp une mthodologie mlant ateliers de dtermination des
objectifs et data scientist outills, permettant de valider au plus tt (sur des chantillons
reprsentatifs) les modles.
117
www.viseo.com
Congrs & Expo
Rendez-vous les
10 & 11 mars 2015
CNIT Paris La Defense
www.bigdataparis.com by
des millions de clients
individuellement.
Imaginez un instant que vous puissiez entretenir une relation privilgie avec chacun de vos clients,
aussi nombreux soient-ils. Avec les solutions analytiques SAP, dimmenses volumes de donnes
structures ou non sont transforms en un puissant outil dintelligence prdictive qui vous permet
dtonner vos clients, daller au-devant de leurs dsirs. O quils soient, en magasin, en ligne
ou sur une application, ils ressentiront ainsi lattention particulire que vous leur portez.
PLUS DE RSULTATS.
CONSTRUISEZ VOTRE HUB DE DONNES DENTREPRISE AVEC
AL
VO
TR
E
E WALGEZ V
E Z
A M RE OTRE
L L G
F R HO DAT
A
IN US A
MA E
syncsort.com/guide