Rapport Big Data CoE (AR-JN.C)

download Rapport Big Data CoE (AR-JN.C)

of 46

  • date post

    02-Feb-2016
  • Category

    Documents

  • view

    215
  • download

    0

Embed Size (px)

Transcript of Rapport Big Data CoE (AR-JN.C)

  • Rapport destination du Comit consultatif de la Convention du Conseil de lEurope pour la protection des personnes lgard du traitement automatis de donnes caractre personnel [ETS. No.108]

    Des donnes et des Hommes Droits et liberts fondamentaux dans un monde de

    donnes massives (premire partie) Antoinette Rouvroy

  • Version du 17 / 09 / 2015

    2

    DES DONNEES ET DES HOMMES.

    DROITS ET LIBERTES FONDAMENTAUX DANS UN MONDE DE DONNEES MASSIVES (PREMIERE PARTIE).

    Antoinette Rouvroy* **

    Table des matires

    Avertissement. 4

    1 Les Big Data : description, enjeux techniques, pistmiques et socitaux........8 1.1. Volume.......................................................................................................8 1.2. Varit......................................................................................................10 1.3. Vlocit ....................................................................................................12 1.4. Fiabilit sans vrit : nouvelles logiques de traitement. ..........................14 ! Une rationalit immanente ......................................................................... 15 ! Personnalisation ou individualisation plutt que catgorisation. .................... 19

    1.5. Conclusion de la premire partie. ............................................................22 2 La Convention 108 du Conseil de lEurope lre des Big Data. ...................26

    2.1. Champ dapplication et dfinitions (article 2.a.) - La notion de donne caractre personnel.............................................................................................26 ! Les risques de ridentification des individus par croisement de donnes anonymes. ................................................................................................. 27 ! Lanonymat ne garantit pas contre les possibilits de caractrisation des comportements des individus, ni contre lanalyse prdictive de ces comportements. ....................................................................................................... 28

    2.2. Principes de base : licit et bonne foi, finalit et proportionnalit, exactitude. ..........................................................................................................29 ! Consentement (article 52) ............................................................................. 29 ! Minimisation des donnes (article 5.4.c) ....................................................... 32 ! Finalit (article 5.4.b) ..................................................................................... 33

    * Permanent Research Fellow of the National Fund for Scientific Research at the Research centre Information, Law and Society (CRIDS), University of Namur, Belgium. ** Pour sa relecture attentive et les commentaires judicieux dont ce travail porte les marques, mes plus sincres remerciements vont Jean-Nol Colin, Professeur en Facult dInformatique lUniversit de Namur, Directeur du centre de recherche Information Systems Engineering (PReCISE).

  • Version du 17 / 09 / 2015

    3

    ! Principe de loyaut et de transparence des traitements (article 5.4.a) ............ 34 ! Principe de limitation dans le temps (article 5.4.e)......................................... 34

    2.3. Donnes sensibles (article 6) ...................................................................34 2.4. Scurit des donnes (Article 7) ..............................................................37 2.5. Transparence des traitements (article 7bis)..............................................39 2.6. Droits des personnes concernes : dcision fonde sur des traitements automatiss de donnes (article 8) .....................................................................40 ! La force normative des dispositifs automatiss. .............................................. 40 ! Dcision automatise et justiciabilit des dcisions. Que mettre en procs : les faits ou les conditions des faits ?.......................................................... 41 ! Toute personne doit pouvoir obtenir, sa demande, connaissance du raisonnement qui sous-tend le traitement de donnes, lorsque les rsultats de ce traitement lui sont appliqus (article 8.c) ....................................................... 44

    3 Conclusions (trs) provisoires..........................................................................45

  • Version du 17 / 09 / 2015

    4

    AVERTISSEMENT Afin de mieux cerner la nouveaut des traitements de type Big Data par rapport aux traitements de donnes caractre personnel concerns notamment par la Convention 108 du Conseil de lEurope, une premire partie de notre rapport sera consacre la description conjointe des donnes concernes par le Big Data, des processus de traitement de ces donnes, et de certains enjeux thiques, juridiques et politiques y affrents. Le choix de traiter ensemble les aspects techniques et socitaux rsulte du constat dune interdpendance inextricable entre les enjeux smiotiques, pistmiques, thique et politique dans le contexte des Big Data. Nous verrons par exemple que les pratiques statistiques impliques dans les analyses de type Big Data instaurent une nouvelle manires de sous-traiter des systmes automatiques la tche de faire surgir de la ralit numrise elle-mme, plutt que de les instituer politiquement ou den convenir contractuellement, les catgories (de mrite, de besoin, de dsirabilit,) prsidant la rpartition des ressources et opportunits dans notre socit. Comprendre la rationalit des processus algorithmiques (datamining, machine learning,) est donc un prsuppos ncessaire toute rflexion normative propos des Big Data en termes dEtat de droit et de droits et liberts fondamentaux. Il nous importera de tenir compte de lvolution et de la diversit des processus de calcul impliqus dans les traitements de type Big Data.1 Les applications des nouvelles techniques danalyse et dexploitations des Big Data sont innombrables. La classe dapplications qui nous intressera ici sera celui celle qui fait intervenir la modlisation des prdispositions et des comportements humains des fins diverses sur base des donnes manant des individus, des contextes dans lesquels ils vivent, ou produites automatiquement.2

    1 Il conviendrait notamment didentifier le plus prcisment possible les processus relevant du Data Mining, du Machine Learning, des Social Network Analysis, des Predictive Analytics, du Sensemaking, du Natural Language Processing, de la Visualization, dans la mesure o ces processus posent des enjeux spcifiques. Dans le prsent rapport, cependant, nous nous sommes surtout intresss au Data Mining et au Machine Learning tout en gardant lesprit que dautres processus de traitements de type Big Data ont des implications marginalement spcifiques en termes de protection des donnes et de protection de la vie prive. 2 Note intempestive: Nous aurions pu tout aussi bien ne plus distinguer entre lhumain et le non-humain ds lors que les Big Data n'ont pas, pour "units", les individus, ni mme les objets, mais les donnes - les notions d'individu, de sujet, de personne, ou mme de groupe, de collectif, de communaut, sont, par dfinition pourrait-on dire, dissoutes et exclues de l'univers des Big Data - et ds lors que le phnomne des Big Data et des nouvelles mthodes de corrlation des donnes clturent le rel numris sur lui-mme, laissant de la sorte lextrieur les corps, les objets physiques, toute chose ayant une forme rsiliente. Ce nest pas par effet danthropocentrisme que lon sintresse plus particulirement la modlisation des prdispositions et comportements humains, plutt qu la modlisation des autres vnements possibles du monde, mais parce que, davantage sans doute que les autres vivants et que les choses

  • Version du 17 / 09 / 2015

    5

    Notre rapport se actuellement en deux parties. La premire partie (Les Big Data : enjeux techniques, pistmiques et socitaux) est une tentative didentification de ce qui fait la nouveaut radicale du monde des Big Data et des enjeux socitaux y affrents. La seconde partie (La Convention 108 du Conseil de lEurope lre des Big Data) sattle, conformment au mandat initial qui nous avait t confi, dtecter les possibilits de contribution du rgime de protection des donnes caractre personnel la rsolution de tout ou partie de ces enjeux socitaux et proposer quelques pistes de rflexion quant lvolution ventuelle de la Convention en vue de tenir compte du phnomne des Big Data. Vu la complexit des enjeux, induisant aussi une complexit dans leur dvoilement et leur exposition (il et fallu pouvoir crire en trois dimensions au moins), nous avons opt pour quelques solutions de prsentation voues faciliter la lecture. Afin de les distinguer des autres considrations, les propositions concrtes que nous avons pu dgager sont prsentes dans des encadrs. Chaque fois que nous faisons rfrence, sans plus de prcision mais en caractres gras des articles numrots, il faut entendre que nous nous rfrons aux articles de la Convention pour la protection des personnes lgard du traitement automatis des donnes caractre personnel dans la version amende rsultant des travaux du Comit consultatif de la Convention 108.3 Idalement, nous souhaiterions poursuivre notre travail dans une troisime partie (Le droit la protection de la vie prive lpreuve des Big Data), prenant acte de la diffrence et de lirrductibilit des enjeux et des instruments de protection des donnes caractre personnel et de protection de la vie prive. inanimes certainement, les humains ragissent gnral