Sie sind auf Seite 1von 5

Atelier des Directeurs Gnraux des Instituts nationaux de la

statistique des Etats membres rgionaux de la BAD sous la


supervision dAFRISTAT
sur la lgislation statistique et linitiative Open data
Bamako, 24 septembre 2013

Linitiative Open Data


Freeman AMEGASHIE, septembre 2013

Introduction
Les notions de Open data , Big data , Data portal ont pris de lessor ces dernires annes dans la
communaut statistique comme dans la communaut scientifique et informationnelle toute entire. Toutes
ces notions tournent autour de la recherche dune plus grande valorisation des donnes existantes pour
rpondre aux besoins dinformations des utilisateurs, des dcideurs ou du grand public. Dans cette note, nous
nous intresserons surtout linitiative douverture publique des donnes, Open data. Il faut aussi dire que
louverture des donnes fait partie dun ensemble plus vaste dinitiatives intitul le gouvernement ouvert
visant (i) la transparence, garant de la confiance mutuelle entre citoyens et politiques, (ii) la participation
citoyenne dans la prise de dcision et (iii) la collaboration pour une meilleure efficacit.
Le concept Open data sentend comme louverture de donnes aux publics. Il sagit de rendre accessibles
au public les donnes statistiques disponibles au sein des institutions. Ce faisant, on remplit lune des
dimensions de la qualit des donnes quest laccessibilit. En effet, laccessibilit de l'information statistique
est dfinie comme la facilit avec laquelle les utilisateurs peuvent lobtenir auprs du producteur. Cette
accessibilit aux donnes concerne autant les indicateurs synthtiques produits par les services statistiques
que les donnes individuelles de base collectes lors des oprations de recensements, denqutes ou les
fichiers administratifs.
Dans la communaut statistique, linitiative Open Data nest pas nouvelle. En effet, depuis quelques dcennies,
des actions ont t inities pour encourager les producteurs des donnes pour leur large diffusion auprs du
public et pour leur ouverture aux chercheurs et universitaires afin quelles puissent bnficier de plus
danalyses. A cet effet, il faut noter que les producteurs de donnes statistiques que sont les INS et les services
statistiques sectoriels nont pas, pour la plupart, les ressources (humaines, financires et temporelles)
ncessaires pour des analyses plus approfondies des donnes collectes grand frais. Mais ce faisant, les
statisticiens doivent garantir la confidentialit des donnes individuelles collectes auprs des units
statistiques dans le cadre de recensements, denqutes ou de fichiers administratifs. Cette notion de secret
statistique est un pilier de la fonction statistique publique.
Conformment son trait, lObservatoire conomique et statistique dAfrique subsaharienne, conscient de
limportance dune bonne utilisation des donnes, appuie ses Etats membres dans la cration et la gestion des
bases et banques de donnes statistiques et dans la diffusion des informations socioconomiques relatives
ses pays. Par ailleurs, Il est important que les SSN diffusent leurs donnes en accord avec la lgislation
statistique nationale. Cest pourquoi, AFRISTAT encourage ses Etats membres laborer et adopter une
politique de diffusion des donnes dfinissant clairement les conditions de diffusion et dutilisation des
donnes de faon garantir leur confidentialit et leur reprsentativit.

1. Les activits de diffusion des donnes statistiques


Rappelons dabord la diffrence que nous mettons entre les bases de donnes dindicateurs statistiques et les
banques de donnes denqutes ou recensements statistiques.
Les bases de donnes dindicateurs statistiques contiennent des indicateurs synthtiques calculs aprs un
travail mthodique des statisticiens pour leur production partir de donnes individuelles collectes au cours
des oprations rgulires ou ponctuelles. Il sagit dindicateurs synthtiques, appels aussi macro-donnes,
dont lensemble des mtadonnes peuvent tre obtenues auprs des producteurs. Les services statistiques
prennent, pour la plupart des cas, des dispositions afin que ces indicateurs soient conformes aux standards et
normes internationaux, de faon garantir leur comparabilit avec les donnes dautres pays. Ils sont dclins
selon des nomenclatures communes dans un souci dharmonisation et de comparabilit.
Les banques de donnes regroupent les donnes individuelles de recensements ou denqutes auprs des
units individuelles, appeles encore micro-donnes. Il sagit des informations individuelles collectes
directement auprs des units primaires denqutes qui nont pas subi dopration de synthse ni dagrgation.
Ce sont ces dernires, traites et extrapoles lensemble de la population tudie, deviennent les indicateurs,
objets des bases de donnes.
Les organisations internationales collectent et laborent une masse considrable de donnes statistiques
relatives aux pays pour leur utilisation propre et pour linformation du public. Souvent, ces organisations
laborent des indicateurs sur la base des estimations lorsque ces informations nexistent pas au niveau des
pays. Initialement destines aux utilisations internes, ces donnes ntaient donc pas diffuses au public. Mais,
depuis quelques annes, ces organisations mettent ces donnes la disposition de tous, en accs libre, gratuit
et facile grce aux nouvelles technologies de linformation et la communication. On pourra consulter utilement
les sites de donnes de la Banque mondiale, http://donnees.banquemondiale.org, de la Division des
statistiques des Nations unies (UNSD), UNData (http://data.un.org), de la BAD, http://opendataforafrica.org/.
Au niveau dAFRISTAT, une base centralise de donnes socioconomiques des Etats membres dite AFRILDB
existe depuis 2000 et permet de diffuser les principaux indicateurs statistiques des pays un niveau agrg ; la
publication des donnes dsagrges est laisse linitiative des pays. Cette base de donnes a t mise en
place avec le soutien de la Banque mondiale. Elle permet la diffusion des donnes, notamment sur le site
Internet http://www.afritat.org/publication. En ce qui concerne les recensements et enqutes auprs des
mnages, la publication des donnes individuelles est du ressort exclusif des pays producteurs.

2. Collaborations et outils diversifis


AFRISTAT, en collaboration avec des partenaires spcialiss, apporte des appuis aux pays pour organiser leurs
donnes en bases et banques de donnes. Les activits dveloppes sont relatives la conservation des
donnes, la documentation, linsertion des mtadonnes des indicateurs, la dfinition de la politique de
diffusion des donnes et la diffusion des donnes. Dans le cadre de ces collaborations, plusieurs systmes de
bases / banques de donnes ont t mis en place dans les pays. En matire de bases de donnes, on peut
citer 2gLDB, DevInfo, Censusinfo, CountryStat, StatBase. Pour les systmes de banques de microdonnes, les
outils utiliss sont le Toolkit/Nada et IMIS/Redatam. AFRISTAT met laccent sur le premier systme.
Avec la Banque mondiale et PARIS21, AFRISTAT est membre du rseau IHSN (International Household survey
network), pour la documentation et larchivage des donnes grce aux outils de Data Management Toolkit et
la mise en place de rpertoires nationaux denqutes avec Nada. Grce au Projet ADP/PARIS21, les cadres de
plusieurs Etats membres ont pu bnficier de formations la documentation et larchivage des donnes
denqutes. Ce qui a abouti la cration de 8 sites nada nationaux (Burkina, Cameroun, Cte dIvoire, Guine,
Guine Bissau, Mali, Niger, Sngal). Les activits se poursuivent pour linstallation des autres sites nada.
2

AFRISTAT encourage et appuie ses Etats membres voluer vers la version de Nada 4. Au niveau central, il est
prvu de disposer dun portail Nada rgional AFRISTAT avant la fin 2014.
AFRISTAT a appuy divers partenaires dans la mise en place des systmes et dans la formation des utilisateurs.
Il sagit de :
2gLDB, de la Banque mondiale, a t installe, en plus de la Direction Gnrale dAFRISTAT, dans cinq
Etats membres (Cameroun, Gabon, Mauritanie, Niger, Sngal) pour la gestion et la diffusion des
indicateurs socio-conomiques. Il permet une diffusion rgulire de publications automatises. Des
travaux et des discussions sont en cours pour la migration vers le Data portal de la BAD.
DevInfo, labor par lUNICEF en collaboration avec le systme des Nations unies afin daider les
Nations unies et les Etats membres suivre les progrs raliss vers les objectifs du Millnaire pour le
dveloppement (OMD). Ce systme a pour objet spcifique de stocker les donnes existantes,
didentifier les lacunes dans les indicateurs OMD, de constituer un point dentre unique pour les
donnes sur les indicateurs OMD, et de diffuser les informations de faon simple et attrayante.
Plusieurs Etats membres dAFRISTAT utilisent ce support pour stocker et diffuser leurs indicateurs de
dveloppement.
CensusInfo, un systme innovant et flexible de base de donnes pour la diffusion des rsultats des
recensements gnraux de la population et de lhabitat dvelopp par la Division de statistique des
Nations unies, en partenariat avec l'UNICEF et le FNUAP, afin d'aider les pays diffuser leurs rsultats
du recensement tout niveau gographique pertinent, sur CD-ROM et sur le Web.
CountrySTAT, de la FAO, est un systme dinformations statistiques en ligne sur lalimentation et
lagriculture lchelle nationale et infranationale. Il permet aux dcideurs daccder aux statistiques
de divers secteurs thmatiques (production, prix, commerce international, consommation, etc.) en
favorisant lanalyse, llaboration et le suivi de politiques dans le but dradiquer lextrme pauvret
et la faim dans le monde .
StatBase, la base de donnes statistiques de la CEA, est une plate-forme Internet pour la compilation,
la production et la diffusion de donnes sur divers indicateurs socio-conomiques des pays africains.
La banque de donnes couvre un large ventail de domaines, dont la population, l'ducation, la sant,
l'agriculture, les mines, l'nergie, l'environnement, les comptes nationaux, le tourisme, le Commerce
ainsi que des indicateurs des objectifs du Millnaire pour le dveloppement (OMD).
IMIS-Redatam est un systme de logiciels conu pour diffuser des fichiers de microdonnes, dans le
respect du secret statistique (ou confidentialit des donnes). Il sagit dune banque de donnes
intgres facile daccs (Intranet/Internet) permettant de gnrer des indicateurs pertinents aux
niveaux national et sous-national grce des possibilits de calcul en ligne. Redatam a t dvelopp
et est distribu par le CELADE (le centre de dmographie de lAmrique latine et des Carabes de la
CEPAL (Commission conomique de lOrganisation des Nations-Unies pour lAmrique latine).
Redatam a bnfici du soutien financier de plusieurs organismes, dont notamment le Centre de
recherches pour le dveloppement international (CRDI) et lAgence canadienne de dveloppement
international (ACDI). Il est en usage par quelques Services statistiques des Etats membres dAFRISTAT.

3. Initiative Open Data de la Banque africaine de dveloppement


Linitiative Open Data de la Banque africaine de dveloppement lance en 2013 avec 20 pays pilotes a pour
objectif damliorer, de manire notable, la gestion et la diffusion des donnes en Afrique . Le Cameroun et
le Sngal sont les deux Etats membres dAFRISTAT figurant parmi les pays et institutions pilotes pour lesquels
3

la BAD dveloppe le portail de donnes (Data portal). Les autres pays devraient tre couverts avant la fin 2013.
Courant mai 2013, une mission de la BAD a sjourn AFRISTAT pour dmarrer les travaux de la mise en place
du portail de donnes dAFRISTAT. Ce dernier devra ouvrir au public bientt sa plateforme. Les deux systmes
de gestion et de diffusion de donnes de la BAD sont Data Portal et Open Data.
Data Portal apparat comme une base de donnes dindicateurs du pays qui permet de grer et de diffuser
facilement les donnes sous forme de tableaux, de graphiques ou de cartes. La manipulation des donnes est
trs aise. Les rapports danalyse gnrs peuvent tre archivs.
Open Data est un entrept de donnes ouvert tous et comportant un certain nombre doutils spcifiques
permettant de gnrer des indicateurs partir de diffrents types de donnes (dmographie, commerce
extrieur, comptes nationaux, enqutes, etc.).
Selon la BAD, Open Data est un outil qui permet dextraire les donnes de la base, de crer et de partager ses
propres rapports personnaliss, ainsi que de visualiser les informations lies des thmatiques, des secteurs
ou des pays, sous forme de tableaux, de graphiques et de cartes.
La plate-forme facilite galement la collecte, l'analyse et la mutualisation des donnes entre les pays, la BAD et
les autres partenaires internationaux au dveloppement. Elle offre aux utilisateurs la possibilit de faire leurs
propres requtes stockables et rutilisables. Cette initiative ne concerne que les indicateurs statistiques.

4. Initiative Open Data de la Banque mondiale


Lengagement de la Banque envers une plus grande ouverture mane galement de sa volont daccrotre
lappropriation par le public, la participation dun vaste ventail de parties prenantes et la conclusion de
partenariats dans le domaine du dveloppement. En tant quinstitution du savoir, la premire mesure de la
Banque mondiale est de partager ses connaissances gratuitement et ouvertement.
Cest pourquoi depuis quelques annes, la Banque a t une des premires institutions internationales
mettre en accs libre et gratuitement un ensemble de donnes de diffrents domaines du dveloppement
lchelle mondiale.
Le Catalogue de donnes de la Banque mondiale permet d'accder plus de 2 000 indicateurs provenant de
sources diversifies, voir http://donnees.banquemondiale.org.

5. La position dAFRISTAT en matire de diffusion des donnes


AFRISTAT adhre parfaitement ces initiatives douverture des donnes au public qui donnent plus de visibilit
au travail des services statistiques. Elles permettent galement denrichir le dbat sur la situation conomique
et sociale des pays par une plus grande utilisation des donnes. Toutefois, sagissant de statistiques officielles
sur lesquelles se basent les dcideurs pour justifier les politiques, il est important quun encadrement soit fait
des utilisations des donnes et de leur origine. Ci-aprs, les prconisations dAFRISTAT selon le type de
donnes diffuser :
5.1. Cas des indicateurs / macro-donnes / bases de donnes :
AFRISTAT milite pour la publication des indicateurs officiels produits par les SSN ;
Les SSN sont les seules institutions qui doivent publier linformation officielle. Les autres diffuseurs ne
doivent servir que de relais ;
AFRISTAT publie sur son site ou (dans ses revues) des donnes officielles agrges et laisse les SSN
publier les donnes dtailles.
4

5.2. Cas des micro-donnes / Banques de donnes :


AFRISTAT milite pour une plus grande valorisation des micro-donnes par des exploitations plus
pousses et la production danalyses par dautres spcialistes, chercheurs et universitaires, oprateurs
conomiques et sociaux. Pour cela, il uvre pour donner aux SSN les capacits de documentation et
darchivage des donnes et pour la diffusion des donnes. Loutil privilgi actuellement est le Data
management Toolkit du rseau IHSN coupl avec le systme Nada ;
Le SSN sont les seules institutions qui doivent donner lautorisation lutilisateur qui en fait la
demande. Pour cela, le SSN doit adopter une politique de diffusion dfinissant notamment les
diffrents types daccs aux donnes et aux mtadonnes.
Diffrents types daccs sont possibles :
o

Accs limit aux mtadonnes : lutilisateur ne peut pas accder aux donnes. Mais, il a accs
toute la documentation possible ;

Accs limit aux donnes :


Extraction des donnes : le producteur ne propose que des fichiers de donnes
extraites, un chantillon. Il ne fournit pas lensemble des donnes.
Exploitation sur place : le producteur met les donnes la disposition des utilisateurs
dans un environnement scuris o ces derniers ralisent des analyses sans
possibilit demporter les donnes ;

Accs total sans limitation : lutilisateur peut accder lensemble des donnes et
mtadonnes.

Dans tous ces cas, lInstitution responsable des donnes prend toutes les mesures ncessaires
garantissant la confidentialit des donnes individuelles et une bonne utilisation de ces donnes. A cet
effet, il devra dabord sassurer de lanonymisation des donnes. Ensuite, il devra conclure des
protocoles daccord pour lutilisation des donnes signer avec les utilisateurs. Toutes les analyses
ralises partir des donnes du SSN doivent recevoir lautorisation pralable du CNS, par
lintermdiaire de lINS, qui en est le secrtariat technique, avant leur publication.
AFRISTAT, en tant quObservatoire conomique et statistique, par son trait, doit recevoir les fichiers des pays
double titre. Il a dabord exercer la fonction darchivage pour garantir les pays contre toute perte de
donnes. Le trait instituant AFRISTAT et sign par les Etats membres, oblige ces derniers lui fournir les bases
et banques de donnes officielles. Ensuite, en tant quobservatoire, il peut raliser des tudes et analyses sur
ces donnes pour ses travaux internes ou au bnfice des Etats. Dans ce dernier cas, AFRISTAT devra prsenter
les rsultats des travaux raliss sur la base de ces donnes aux pays propritaires et obtenir leur accord avant
toute publication.
Un autre avantage pour les pays, en filigrane, est la rduction du temps consacr rpondre aux
questionnaires rguliers des institutions internationales, par la possibilit que ces dernires auront maintenant
collecter directement les informations sur le portail de donnes de linstitution.

Conclusion et perspectives
AFRISTAT est dispos collaborer avec les autres partenaires internationaux au dveloppement pour appuyer
ses Etats membres dans les activits menant une ouverture publique des donnes statistiques quils
produisent en les prservant des inconvnients afin quils tirent plutt des avantages de linitiative Open Data.
Il devra dployer des actions pour aider ses Etats membres adopter une politique de diffusion des donnes en
harmonie avec les lois statistiques nationales.
5

Das könnte Ihnen auch gefallen