Sie sind auf Seite 1von 8

Stphane Tuffry

Statisticien - Data Miner - Enseignant

DATA MINING - SCORING


STATISTIQUE DCISIONNELLE
APPLICATION AU CRM

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

Plan du cours

Quest-ce que le data mining ?


A quoi sert le data mining ?
Les 2 grandes familles de techniques
Le droulement dun projet de data mining
Cots et gains du data mining
Facteurs de succs - Erreurs viter
Informatique dcisionnelle et de gestion
La prparation des donnes
Techniques descriptives de data mining
Techniques prdictives de data mining
Logiciels et consultants
Le text mining
Le web mining
CNIL et limites lgales du data mining
18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

Les limites lgales de


lutilisation des donnes

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

Informatique et liberts

Comme tout traitement informatique de donnes sur des

personnes physiques, le data mining obit en France


un certain nombre de rgles, dictes dans ces textes :

la loi n 78-17 du 6 janvier 1978 relative linformatique,


aux fichiers et aux liberts
les dlibrations de la Commission Nationale de
lInformatique et des Liberts (CNIL)
la Convention n 108 du Conseil de lEurope du 28/1/1981
la loi n 2004-801 du 6 aot 2004 relative la protection
des personnes physiques l'gard des traitements de
donnes caractre personnel, transposant en droit
franais la directive europenne 95/46/CE, en modifiant la
loi n 78-17

On trouve ces rgles sur le site www.cnil.fr de la CNIL


18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

Champ dapplication des textes

Informations nominatives (dites encore donnes

caractre personnel), cest--dire celles concernant les


personnes physiques identifies ou identifiables

ne sont pas concerns les fichiers de personnes physiques


rendues anonymes par la suppression de tout identifiant
sont concerns les fichiers dentreprises unipersonnelles

Traitements informatiques de ces informations

mme ceux qui se bornent les collecter et les


enregistrer, en dehors de toute mise en uvre ou de
toute exploitation (article 5 de la loi 78-17).

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

Donnes lgalement utilisables

Ne doivent tre, sauf cas particulier, ni traites ni mme


collectes, les informations sur :

les origines raciales


les opinions politiques, philosophiques ou religieuses
les appartenances syndicales
les murs
la sant
les condamnations pnales
NIR, no dinscription au rpertoire national didentification
des personnes physiques

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

Droits des personnes physiques 1/3

Les

personnes physiques ont le droit que


informations nominatives les concernant soient :

les

lgalement utilisables
loyalement collectes
stockes en scurit
communiques aux seuls tiers autoriss
rectifies si besoin est
enregistres pour des finalits dtermines et lgitimes,
par rapport auxquelles elles sont pertinentes et non
excessives
effaces au bout dun certain dlai (correspondant la
finalit du traitement dclar).

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

Droits des personnes physiques 2/3

De faon gnrale, les personnes physiques :

doivent avoir connaissance des destinataires des


informations nominatives quelles fournissent, de leur droit
daccs et de rectification, et, le cas chant, de la
possibilit de ne pas rpondre aux questions facultatives :
droit linformation
doivent avoir connaissance de la cessibilit dinformations
nominatives les concernant avec une finalit identique
celle dorigine
doivent avoir connaissance de la cessibilit dinformations
nominatives les concernant avec une finalit diffrente de
celle dorigine (prospection commerciale par exemple) et
doivent les accepter expressment.

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

Droits des personnes physiques 3/3

De faon gnrale, les personnes physiques :

peuvent avoir connaissance ( leur demande) des


informations nominatives mmorises les concernant, de
lexistence et de la finalit dun traitement informatique les
concernant (articles 22 et 34) : droit daccs
peuvent sopposer, pour des raisons lgitimes, un
traitement informatique dinformations nominatives les
concernant (article 26) : droit dopposition
ne peuvent pas exiger davoir connaissance du dtail du
traitement, moins (article 3) que ces traitements fondent
une dcision quelles contestent.

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

Dclarations de traitements

La dclaration faire la CNIL pralablement la mise en

uvre dun nouveau traitement automatis de donnes


caractre personnel (un traitement de data mining, par
exemple) est :

soit une dclaration simplifie, qui n'exige qu'un


minimum d'informations, mais l'engagement que la
dclaration soit strictement conforme l'une des normes
simplifies en vigueur
soit une dclaration ordinaire, dans les autres cas.

Les dclarations de sites Web peuvent tre faites en ligne.


La CNIL a reu 69 352 dclarations de traitement en 2003,

et son fichier des fichiers recensait 941 076


traitements le 31/12/2003.

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

10

La loi 2004-801

(transposant la directive europenne 95/46/CE)

Abolit la distinction entre secteurs public et priv

hormis les traitements publics lis la scurit


le secteur public nest plus le seul devoir requrir
lautorisation pralable de la CNIL dans certains cas

Instaure une distinction entre traitements sensibles ou non

traitements sensibles : demande dautorisation pralable


autres traitements : dclaration
voire exonration de dclaration (ex : paie du personnel)

Un traitement peut tre dit sensible en raison de :

la nature des donnes (NIR, donnes biomtriques,


gntiques, sensibles, relatives aux condamnations)
lampleur des traitements (totalit de la population franaise)
la finalit des traitements (scoring, exclusion du bnfice
dun droit, listes noires , interconnexion de fichiers)

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

11

La loi 2004-801

(transposant la directive europenne 95/46/CE)

Cre les correspondants la protection


(CPO) dans les entreprises (article 22)

des donnes

chargs de tenir le registre des traitements mis en uvre et


dassurer le respect des obligations lgales
non obligatoires pour lentreprise
dispensent lentreprise des dclarations mais non des
autorisations pralables de traitements sensibles
nomms par lentreprise sans accrditation de la CNIL
pourront tre choisis au sein ou lextrieur de lentreprise
devront jouir dune certaine indpendance dans lentreprise

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

12

Nouveaux pouvoirs de la CNIL


dans la loi de 2004

Accder

tout local professionnel servant lexploitation


d'un fichier
Rendre publics ses avertissements
Infliger des amendes jusqu 150 000 (300 000 en cas
de rcidive)

au lieu de se limiter dnoncer les infractions au Parquet

Retirer une autorisation dj donne


Interdire un traitement pendant une dure max de 3 mois

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

13

Spcificits du scoring de risque

Un

score de risque doit faire lobjet dune dclaration


ordinaire et non simplifie.
Cette dclaration doit indiquer les variables utilises, les
paramtres du score et les grilles de pondration.
Aucune dcision accordant ou refusant un crdit ne peut
avoir pour seul fondement un traitement automatis
d'informations donnant une dfinition du profil ou de la
personnalit de l'intress.
Toute personne laquelle un refus de crdit est oppos
bnficie du droit d'accs aux informations utilises lors
de l'examen de sa demande (y compris sa note de
score) et peut, le cas chant, en exiger la rectification.

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

14

Spcificits de la segmentation

La CNIL admet laffectation des clients en segments de


clientle, sous les rserves suivantes :

informations collectes adquates, pertinentes et non


excessives
droit daccs aux informations
mise jour priodique de laffectation un segment
non-automaticit et non-inluctabilit des dcisions en
dcoulant
non-cession de ces informations des tiers non autoriss.

Les segments ne doivent pas comporter de qualificatifs

pjoratifs, dfavorables ou subjectifs sur les catgories


dindividus, tels que temprament de jouisseur ;
sont en revanche admises les catgories : vivant
crdit , clients aiss et gs , petits pargnants .

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

15

Fichiers de crdit

Fichiers ngatifs : ne contiennent que les emprunteurs


ayant des incidents de remboursement

fichier FICP en France

Fichiers positifs : contiennent tous les emprunteurs,


avec les montants et chances des endettements
contracts

voire des donnes sur les charges, les revenus, le


patrimoine, le logement, lemploi (aux USA)
fichiers utiliss par les professionnels du crdit, avec
ouverture la tlphonie, la VPC, le secteur du logement
fichiers interdits en France, mais autoriss en Allemagne,

Autriche, Italie, Espagne, Portugal, Pays-Bas, Belgique, Royaume-Uni

dbat relanc fin 2003 par le secrtaire dtat aux PME mais la
CNIL raffirme son opposition le 13/5/2004 et le CNCT le
20/7/2004

18/12/2004

Stphane Tuffry - Data Mining & Scoring - http://data.mining.free.fr

PDF created with pdfFactory Pro trial version www.pdffactory.com

16

Das könnte Ihnen auch gefallen