Beruflich Dokumente
Kultur Dokumente
Livre blanc
Du Big Data
au Big Busine$$
Livre 1 : Phénomène de mode
ou facteur de performance ?
du Big Data au Big Business - LIVRE 1
Sommaire - p.02
01 03
chapitre chapitre
02
chapitre
04
chapitre
Sommaire - p.03
05 07
chapitre chapitre
Les métiers des Big Data p.29 Comment passer des Big Data p.37
au Big Busine$$
06
chapitre
Chapitre 01
Big Data, contexte
et fondements
1 2
Ceci d’autant plus que les Big data impliquent de http://trends.levif.be/economie/actualite/entreprises/
nouvelles formes de raisonnements, qui embrassent les-big-data-posent-probleme-aux-marketers/
notamment les formes de raisonnements inductifs (cf. article-4000606787740.htm
page 8). On peut sans grand risque parler des Big data
comme d’une nouvelle philosophie et une nouvelle
façon de penser le marketing.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data, contexte et fondements - p.05
3
Le, la ou les Big Data ? Big Data est un nom anglais
(littéralement « grosses données » et ne nécessite pas
d’être mis au féminin ni au masculin. Le mot « data »
étant le pluriel latin de Datum, nous avons décidé
de garder ce nom au pluriel dans ce document.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data, contexte et fondements - p.06
Ainsi, le Big Data a pour objectif d’ex- Gil Press fait même remonter les
ploiter des volumes de données qui origines de cette nouvelle discipline à
sont en croissance exponentielle et une date plus que lointaine5 (1944 !).
qui deviennent difficiles à travailler Mais sans aller jusque-là, et même si
avec des outils classiques de gestion la paternité de l’invention du terme
de base de données ou de gestion de « Big Data6 » fait l’objet de débats
l’information4. Elle a aussi pour objec- assez techniques, on peut facilement
tif de traiter rapidement des données remonter au début de 2001, selon
complexes. le cabinet d’analyse Gartner, pour
trouver les premiers écrits sur les
Si l’on se réfère aux travaux de the 451 fameux 3V (Volume, Vélocité et
group et Gartner, on trouve la formu- Variété), prédisant l’explosion de
lation suivante ; Les big Data visent à la donnée et la naissance d’une
tirer un avantage concurrentiel des nouvelle forme de traitement de
méthodes de collecte, d’analyse et celle-ci.
d’exploitation des données qu’on ne
pouvait utiliser jusqu’à présent du fait Il faut préciser également que les
des contraintes économiques, fonc- Big Data sont aussi l’aboutissement
tionnelles et techniques liées aux vo- de la démarche de Data Mining, en
lumétries, à la vitesse de traitement et vogue dans les années 1995-2000,
à la variété des données à considérer. elle même issue de deux écoles
(ou tendances) assez anciennes
Rupture ou évolution ? que sont la statistique d’un côté et
l’intelligence artificielle d’un autre.
Les Big Data sont parfois présentées
comme un phénomène en rupture La fonction crée l’organe
complète avec ce qui ce qui a pu se
faire jusqu’à aujourd’hui en terme
d’aide à la décision, ou au contraire,
comme une simple évolution des or-
ganisations et des systèmes décision-
nels. La question est plus importante
qu’il n’y paraît, et ne se réduit pas à
un simple problème sémantique.
Cette importance, pour l’entreprise
se traduit par le fait qu’en fonction de
la réponse, les scénarios mis en place
seront probablement très différents.
4 5
Voir également cette définition complète dans http://www.forbes.com/sites/gilpress/2013/05/09/a-very-
l’encyclopédie ouverte Wikipedia dont nous nous short-history-of-big-data
sommes inspirés :
http://fr.wikipedia.org/wiki/Big_data
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data, contexte et fondements - p.07
Qu’est-ce au juste qu’un signal faible ? Les Big Data sont un moyen
Philippe Cahen nous livre sa définition d’alimenter la réflexion, et l’action,
dans son ouvrage « tout savoir sur… le autour de ces signaux faibles, en
marketing de l’incertain » : partant d’hypothèses que l’on peut
vérifier en faisant des croisements
« Un signal faible est une information entre données et comportements.
paradoxale de réflexion […]. Un signal
faible n’est pas un petit fait porteur
d’avenir. Ce serait trop simple en effet, Source : « Le Marketing de l’incertain »
voire naïf, d’imaginer que l’on trouve par Philippe Cahen, éditions Kawa, 2012
6 7
Voir cet article sur le blog du New York Times : Cf. l’article de Lise Gasnier sur Solucom Insight
http://bits.blogs.nytimes.com/2013/02/01/the-origins- http://www.solucominsight.fr/2013/08/auw-origines-
of-big-data-an-etymological-detective-story du-big-data
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data, contexte et fondements - p.08
Chapitre 02
Les données
8
Exemples de données semi structurées : messages mail,
log etc.) ; et non structurées : photo, vidéo, son.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.10
9 10
Pour la paternité des 3V et les nombreux prétendants à Appelées aussi « analyse de tonalité » en français,
leur invention, voir l’article de Doug Laney : « Deja VVVu: équivalent de « sentiment analysis » en anglais.
Others Claiming Gartner’s Construct for Big Data » : 11
Voir notre chapitre sur les nouveaux métiers des Big
http://blogs.gartner.com/doug-laney/deja-vvvue-others- Data à la page 21 pour plus de détails sur ce nouveau
claiming-gartners-volume-velocity-variety-construct- profil.
for-big-data
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.12
12
Ou « traitement par lots » en français, c’est-à-dire
à l’opposé du mode temps réel, le traitement des
données qui ont été préalablement déportées sur
un espace de stockage.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.13
Usages
• Prévision / prédiction
• Prévention
• Personnalisation
Données
• Vitesse
Connaissance • Volume
• Variété
• Véracité
• Valeur
13
Cf. http://en.wikipedia.org/wiki/Garbage_in,_garbage_
out
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.14
Explication du phénomène............
....................................................Action
............Identification du problème ?
BI
.Tableau de bord (où/quand/comment… ?)
.........................................................................................Quoi ?
14
Nous nous sommes inspirés librement du texte
de Bellinger, Castro et Mills à l’adresse :
http://www.systems-thinking.org/dikw/dikw.htm
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.16
15 16
Voir le résumé de la Méthode d’Edgar Morin à http://www.piloter.org/business-intelligence/mdm.htm
l’adresse : http://fr.wikipedia.org/wiki/La_Méthode_
(Edgar_Morin)#La_connaissance_de_la_connaissance
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les données - p.17
Ce qu’on observe sur le terrain, c’est Alors que, a priori, la donnée brute
qu’une robustesse de 95 % (soit 95 % n’a aucune importance, par son croi-
de chances que le résultat soit juste), sement et sa validation statistique,
est très acceptable, et une telle don- elle finit par prendre de la valeur au
née sera donc considérée comme fur et à mesure, non au travers de la
fiable. La prise en compte de ce degré déduction, mais au travers de l’induc-
d’incertitude autant dans les données tion et de l’inférence statistique. Sans
que dans les résultats, est donc essen- aller jusqu’à l’intelligence artificielle (où
tielle dans la mise en place d’un projet la machine décide de la validité d’une
de Big Data. donnée), avec le Big Data, c’est le croi-
sement statistique des données qui
La mesure de cette incertitude se fait finit par créer de la valeur et du sens.
au travers d’outils de mesure dont le C’est ainsi que l’on peut considérer
plus connu est celui dit de « p-value ». que la donnée donne naissance à l’in-
formation, même si cela peut paraître
à l’origine contre-intuitif.
Chapitre 03
Les nouveaux usages induits
par les Big Data
L’apport des Big Data est de venir le silo où elles ont été créées et
chercher dans les données dispo- souvent limités à l’usage premier qui
nibles dans l’entreprise en interne, les a générés. Par exemple :
ou dans son écosystème, le moyen
de générer des usages innovants et •u
ne donnée de compteur pour l’éta-
des facteurs de performance. blissement d’un relevé ;
Comment Fidéliser
les clients pour accroître
le taux de remplissage
des hôtels
• Le taux de clic sur les invites Les Réseaux Sociaux (Twitter, Face-
diffusées sur les pages du site book, LinkedIn etc.) génèrent eux-aus-
internet ont été multiplies par si des volumes de données considé-
deux grâce à la personnalisation rables. Accessibles publiquement via
des messages ; des API (Application Program Inter-
face18), des programmes d’interface
• Les taux de clic, ratios de conver- qui permettent de siphonner les
sion, la mesure du cycle de vie de données d’une application et de les
chaque client, et bien d’autres réinjecter dans une autre, ces don-
indicateurs sont mesués et consi- nées « sociales » peuvent constituer
gnés dans les tableaux de bord; une source d’information pour des
entreprises dont la réputation est
Ce projet de Big Data appliqué ainsi exposée au grand jour : Biens
au marketing a permis de lancer de consommation, Agroalimentaire,
une véritable offre de marketing Luxe, Distribution et peut-être de-
1 to 1 sur un marché de masse en main Assurance sont des secteurs qui
alliant intelligence logicielle et ac- disposent ainsi d’une manne de don-
tion humaine. nées externes abondante.
Il s’agit d’un des projets les plus Considérées comme « non structu-
ambitieux d’Europe dans le do- rées » ces données, en grande partie
maine du tourisme, un cas d’école textuelles, embarquent également de
de « transformation digitale ». Ce la vidéo et des photos. Si elles sont
projet est une réalisation Bu- abondantes, ces données non struc-
siness & Decision. turées (commentaires, avis…) ont une
pertinence intrinsèque limitée. Les
« signaux faibles » qu’elles génèrent
n’auront de vraies valeurs que croi-
sées à d’autres données19.
L’utilisation d’une carte SIM, d’une
connexion Bluetooth, ou de tout autre La problématique à laquelle l’entre-
protocole n’étant pas limitée aux per- prise est confrontée est l’expansion
sonnes physiques, l’Internet des ob- des champs applicatifs générés par
jets va générer également un volume la maîtrise de ces nouveaux types
de données considérable dans un de données. Si on s’intéresse par
grand nombre de secteurs : Automo- exemple à la reconnaissance faciale,
bile, Santé, Distribution d’énergie… qui est l’une des priorités de nombre
des géants de l’internet. Le potentiel
Selon Michel Lévy-Provençal, le de création de valeur des applica-
nombre d’objets connectés dans tions liées à cette donnée justifie les
le monde, principalement des ordi- investissements colossaux qui sont
nateurs, des téléphones et des ta- réalisés actuellement. Dès qu’elle
blettes est estimé à 5 milliards, en sera maîtrisée, il faudra pour l’entre-
2015, ils devraient atteindre 15 mil- prise concernée, mettre à jour tous
liards et 50 milliards en 2020 17. Il fait ses référentiels et bon nombre de ses
aussi mentionner l’arrivée en masse applications marketing si elle ne veut
du paiement sans contact et, no- pas se retrouver à la traine face à de
tamment, de iBeacon qui va faire nouveaux entrants ou des concur-
donner à cette tendance une impor- rents plus prompts à réaliser des in-
tance croissante. vestissements dans ce domaine.
17 19
Cf. cet article sur le site de SFR et cette interview de Il est à noter cependant que des progrès notables
Michel Lévy-Provençal : http://bit.ly/sfrlevyp restent à faire dans le domaine de l’exploitation de ces
18
http://encyclopedia2.thefreedictionary.com/ données multimédia.
Application+Program+Interface
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les nouveaux usages induits par les Big Data - p.22
20 22
Pour des explications sur Hadoop et Map Reduce, Sur la conversion progressive de la RATP à l’Open Data,
voir la page 20. voir cet article sur le blog du Monde : http://data.blog.
21
Voir le site : www.qlik.com/fr lemonde.fr/2013/01/09/stations-desertes-temperatures-
quand-la-ratp-ouvre-ses-donnees/ agrémenté d’exemples
de ce qui peut être fait avec ces données.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les nouveaux usages induits par les Big Data - p.23
Chapitre 04
Les architectures
et les algorithmes
23
IaaS : Infrastructure as a Service, c’est-à-dire
la capacité d’acheter de l’infrastructure déportée
et de la consommer à la demande, de la même manière
que ce que l’on fait pour les logiciels SaaS (Software as
a Service).
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les architectures et les algorithmes - p.25
24 25
Un framework logiciel est un ensemble méthodologique Pour l’explication de Map/Reduce, voir la page 19 de ce
et d’outillage lié à un langage de programmation. document.
Cf. http://fr.wikipedia.org/wiki/Framework
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les architectures et les algorithmes - p.26
: Statuses CF
key Columns
" 1 " " text ": " Nom nom nom " " user_id ": " 5 "
key
PRODUIT DESCRIPTION
1 " 2 " " text ": " @evan Zzzzzz… " " in_reply ": " 8 " " user_id ": " 5 "
chou légume vert
: Status Audits CF
: Status Relationships CF
PRODUIT DESCRIPTION
2
carotte légume orange : Users CF
key Columns
" 5 " " screen_name ": " buttons cat "
PRODUIT DESCRIPTION
3 : User Relationships super CF
navet légume sans goût
ke Supercolumns
" 5 " " user_timeline ": " 2 ": " " " 1 ": " " " home_timeline ": " 8 ": " "
Figure 9. Au contraire, avec une base Figure 10. Evan Weaver décrit comment
de données colonne, comme dans l’exemple Cassandra traite les enregistrements de données
ci-dessus, le nombre de colonnes peut varier dans sa base clé/valeur.27
pour chaque enregistrement.
26 27
Cf. http://www.journaldunet.com/developpeur/outils/ http://blog.evanweaver.com/2009/07/06/up-and-running-
comparatif-des-bases-nosql/hbase.shtml with-cassandra
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les architectures et les algorithmes - p.28
28 29
« insert (SQL) » : http://fr.wikipedia.org/wiki/Insert_ Autrefois appelé KXEN : Voir http://en.wikipedia.org/
(SQL) « jointure » ou « join » en anglais : wiki/KXEN_Inc.
http://fr.wikipedia.org/wiki/Jointure_(informatique)
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les métiers des Big Data - p.29
Chapitre 05
les métiers des Big Data
MATHS
MACHINE
HACKING LEARNING & STATISTICS
SKILLS KNOWLEDGE
DATA
SCIENCE
DANGER TRADITIONAL
ZONE ! RESEARCH
SUBSTANTIVE
EXPERTISE
Figure 11. La science des données (selon Drew Conway)30 insiste sur la combinaison de connais-
sances de fond (substantive expertise), de talents techniques (hacking skills) et de connaissances en
mathématique et en statistique. C’est la combinaison de ces expertises qui permet d’éviter les écueils
décrits par Conway. Nul doute qu’il faille former des experts…
30
Le diagramme de Venn des data sciences de Drew
Conway : http://drewconway.com/zia/2013/3/26/the-
data-science-venn-diagram
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Les métiers des Big Data - p.30
Ces nouveaux métiers offrent désor- tisser des liens entre la donnée de ré-
mais des perspectives de carrière férence et la donnée relationnelle, la
et ne sont plus une « punition ». Ces donnée de fait, celle de ses achats.
postes étaient traditionnellement
considérés comme des « placards » ; Le Big Data vient donc enrichir ce capi-
ce n’est plus vrai aujourd’hui. tal initial avec des données comporte-
mentales, les accointances du consom-
Les grandes écoles (citons HEC, EN- mateur avec différentes marques et
SAE, Essec) proposent aujourd’hui ses réseaux en général, notamment
des formations autour de la donnée. à travers les divers réseaux et médias
HEC a intégré une dimension don- sociaux. On a donc besoin de ces dif-
née dans son programme de MBA, férents types de données pour mettre
c’est un signal fort. Et cela s’adresse en place une vision métier.
à des gens qui sont amenés, par cette
formation, à remplir des rôles impor- Le travail de Big Data ne peut pas se
tants dans les organisations dans les- concevoir en dehors de cette réalité,
quelles ils travaillent. même si les sources (Facebook, Google,
Amazon etc.) ont une existence propre.
Le lien entre MDM et Big Data L’intelligence est dans les liens entre les
données, c’est ce qui va transformer
À l’Entreprise Information Manage- multiplier la valeur de la donnée.
ment Summit 2013 à Londres organi-
sé par Gartner, le cabinet d’analyse a Exemple d’illustration
insisté sur la nécessité d’étendre cette de la distribution
maturité et cette structuration autour
de la donnée de référence (MDM) La tendance actuelle n’est plus au
vers la donnée semi ou non structu- multicanal, mais à l’omnicanal. Pour
rée. C’est cela qui va faire le lien entre mettre cela en place, cela implique
MDM et Big Data. une bonne connaissance du client,
pour pouvoir lui proposer de la
MDM et Big Data sont tout à fait com- personnalisation, du MDM, pour
plémentaires. C’est un cas d’usage bien le connaître, de la BI et enfin des
qu’on retrouve dans la littérature, réseaux sociaux.
mais qui en réalité n’est pas encore
véritablement mis en œuvre en Si le distributeur connaît bien ses
France. Si le Big Data est synonyme produits, qu’il fournit l’information
de foisonnement et de chaos (sou- pertinente quel que soit le canal, et
vent créateur), le MDM est ce qui per- qu’il connaît bien ses stocks (via le BI
met de mettre de l’ordre dans tout et le lien notamment vers les ERP), il
cela, permettant de rendre structuré est capable de personnaliser l’offre
quelque chose qui ne l’est pas, de le son client, en tirant des liens entre ces
classer et de l’organiser. différents niveaux de données..
Exemple d’illustration
Chapitre 06
Big Data ou Big Brother ?
Les Big Data ne laissent personne in- eu lieu vers les débuts du Web au dé-
différent, soit pour évoquer en elles but des années 1990.
le futur de l’informatique et un nouvel
ordre économique, soit pour les fusti- Côté pile : l’espoir d’un secteur
ger et les pointer du doigt comme dé- dynamisant qui vient irriguer
rive orwellienne d’une société scien- toute l’économie
tiste devenue incontrôlable.
Lors d’un récent matin de l’écono-
Il ne s’agit d’ailleurs pas que d’un dé- mie organisé par le Journal du Di-
bat d’idée, car le jugement rendu par manche et dont Business & Decision
l’Union Européenne à l’encontre du était co-sponsor, Philippe Oddo de la
géant Google en juin 2014 est sym- Banque éponyme a déclaré en guise
bolique d’un malaise profond dans d’introduction : “le Big data c’est sur-
une société où une minorité d’utilisa- tout la collecte et le traitement de
teurs très agissante, lance un débat l’information pour anticiper au mieux
démocratique qu’il n’est pas question ce qui va se passer dans tous les sec-
ici d’éluder, ni même de remettre en teurs et particulièrement dans celui de
cause. L’avènement des Big Data est l’analyse financière”. Avec une pareille
bel et bien une nouvelle donne éco- entrée en matière, il n’y a pas de doute
nomique, même si elle ne vient pas possible … les Big Data sont l’avenir de
bousculer tout sur son passage non la high tech mais aussi de beaucoup
plus. Et cette nouveauté ne vient de secteurs plus traditionnels. Le fait
que renforcer les devoirs moraux et que l’assertion vienne d’un homme du
d’éthique des entreprises, dont l’en- métier est un signal fort.
gagement citoyen devient aujourd’hui
une obligation à défaut d’être un Côté face : le débat sur la vie
choix. privée
En quelque sorte, les débats qui sur- Ce sujet est véritablement au cœur
gissent aujourd’hui autour des Big de l’économie (notamment dans la
Data sont très similaires à ceux qui ont « Presse qui possède énormément
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data ou Big Brother ? - p.35
31
Article du JDD paru le 8 février 2014 : http://www.
lejdd.fr/Economie/Entreprises/Laurent-Alexandre-La-
strategie-secrete-de-Google-apparait-652106
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Big Data ou Big Brother ? - p.36
Chapitre 07
Comment passer des Big Data
au Big Busine$$
Que retenir des Big Data ? aliser si les données sont stockées
dans certains formats décentralisés.
En conclusion, que faut-il retenir des L’utilisation de ces formats interdit
Big Data ? Certainement qu’avant donc certains types d’exploitation.
toute chose, il convient de com-
prendre ce que c’est, qu’il ne faut Sans évoquer les cas extrêmes, cer-
pas conclure hâtivement et péremp- tains traitements Big Data prennent
toirement que rien n’a changé, ni au du temps, un temps qui augmente
contraire que rien n’est plus comme souvent exponentiellement avec le
avant. La réalité est tout autre. volume des données.
Avant toute chose, il faut définitive- Pour obtenir des temps de réponse
ment se départir de certains mythes : acceptables, on devra donc souvent
tout vouloir analyser en Big Data est faire un compromis entre la quantité
purement utopique. De la même fa- de données prises en compte et le
çon, l’idée qu’il faut tout stocker dans temps dont on dispose pour le trai-
le but « d’en faire quelque chose un tement. Le fait de maintenir certains
jour » est tout autant fantaisiste. calculs intermédiaires à jour dans
des entrepôts de données orientés
D’abord, stocker des données inutiles « métier » peut aussi considérable-
coûte cher, en Big Data encore plus ment aider à écarter ce problème et
que dans des projets plus tradition- à réduire les temps de calcul à des
nels de Business Intelligence. Mais niveaux acceptables.
surtout, le stockage doit être pensé
dès le départ, en vue des traitements Si on est capable d’intégrer tous ces
à effectuer. Comme nous l’avons vu points il sera possible de passer du
précédemment, il existe des traite- Big Data au « Big Business ».
ments statistiques impossibles à ré-
33 34
Cf. http://bit.ly/privateZuck pour son intervention sur le Cf. la charte d’éthique du groupe Orange, clairement
sujet fin 2009. La phrase avait fait beaucoup réagir sur orientée en ce sens : http://oran.ge/SMYku4
les médias sociaux comme ailleurs, forçant Facebook
à donner des preuves de respect des données privées
à plusieurs reprises … sans bien convaincre personne
au final.
du Big Data au Big Business - LIVRE 1 SOMMAIRE
Comment passer des Big Data au Big Busine$$ - p.38
6. O
n peut faire des Big Data dès Nous l’avons évoqué dans ce livre
maintenant car les technologies blanc, un projet Big Data a ses spé-
sont disponibles cificités. Au delà de l’approche tech-
nique, il induit des méthodologies
Les Big Data ne sont pas non plus particulières, un cadre juridique
une prévision, elles sont déjà dis- adapté et un bonne mesure des im-
ponibles, ici et maintenant, même pacts sociaux.
si leur paysage évolue à grande vi-
tesse. Bon nombre des technologies Un apprentissage sera donc néces-
utilisées dans le cadre des Big Data saire ; il ne s’agit d’ailleurs pas d’un
ont en effet été inventées et popula- savoir fini, les Big Data sont en re-
risées par les géants du Web (Google configuration constante.
et Yahoo! font partie des pionniers)
et sont désormais mises à disposi- 9. L
es Big Data sont incontour-
tion de tous ceux qui sont capables nables, et toutes les entreprises
de les mettre en œuvre. en feront, comme l’Internet
7. L
a donnée est probablement Les véritables innovations suivent
la matière première la moins toujours un schéma d’adoption à peu
connue et la moins comprise près similaire, fort bien décrit par
Geoffrey Moore dans « Crossing the
La distinction entre système d’infor- Chasm », son best seller des années
mation (l’ensemble des processus et 90. Les Big Data en sont à un point
des organisations entre les données, d’inflexion qui fait que leur adoption
leur naissance, leur vie, leur traitement se généralise et sort du cercle fermé
et leur archivage) et système infor- des géants du Web et des médias
matique (la mécanique matérielle et sociaux qui les ont inventées. Il est
surtout logicielle qui permet de faire désormais possible d’appliquer ces
tourner l’ensemble et de traiter la don- techniques et ces approches aux
née) est un grand classique. La don- entreprises faisant partie des sec-
née est encore aujourd’hui un espace teurs plus traditionnels. Nous n’en
largement méconnu des responsables sommes qu’au tout début.
« métier » qui considèrent encore les
systèmes informatiques comme des 10. L
es Big Data ne se limitent pas
formules magiques capables de trans- au temps reel
former le business sans effort.
Même si Hadoop est une grande in-
Or, la donnée est capricieuse, et elle novation, les Big Data ne se limitent
requiert beaucoup de travail. Son im- pas à Hadoop et encore moins au
portance croissante dans une socié- temps réel. Certains de ces usages
té où l’informatisation est omnipré- sont en effet adaptés à de grands
sente, dans tous les secteurs, force à volumes de données et nécessitent,
changer la perception de cette don- selon les cas, des traitements dépor-
née par l’utilisateur. Beaucoup reste tés. C’est la bonne combinaison des
encore à faire pour que ce change- différentes approches et techniques
ment soit totalement abouti. qui fera la qualité et le résultat d’un
projet de Big Data.
8. Un projet Big Data se gère
différemment C’est en intégrant ces différents
points qui font les spécificités des
Les Big Data ne sont pas une mode vraies Big Data, que les entreprises
ni le simple changement de nom de demain pourront passer des Big
du datamining. Elles ont leur voca- Data au Big Business.
bulaire, leurs professionnels, leurs
méthodes, leurs algorithmes, et leurs
approches projets spécifiques.
SOMMAIRE
blog.businessdecision.com