Données Publiques et Opendata
Par Guillaume le samedi 14 juillet 2012, 18:09 - Humeur - Lien permanent
Peut-être avez vous suivi ces dernières années l'affaire "NotreFamille contre le Cantal". 1er épisode en juillet 2011 lorsque le tribunal administratif de Clermont-Ferrand donne raison au plaignant lien vers le résumé sur le site de la RFG. En octobre le département faisait appel lien vers le résumé sur le site de la RFG. Enfin le 4 juillet 2012 la Cour administrative d’appel de Lyon rendait un arrêt dont le moins qu'on puisse dire est qu'il est à lecture multiple.
La gazette des communes en déduit que le département était dans son bon droit en refusant la demande (en soulignant que la demande de la société Notrefamille.com portant sur la réutilisation d’informations publiques comportant des données à caractère personnel, le département du Cantal n’était pas tenu de satisfaire cette demande). De l'autre côté la société Notrefamille.com publie sur son site un communiqué de presse où le PDG envisage les suites de cet arrêt de manière positive (Cette décision nous permet de reprendre les discussions avec le département du Cantal pour que soit enfin effectivement mis en oeuvre le droit de NotreFamille.com à réutiliser les images d’archives d’état-civil et de recensements).
Le même communiqué de presse met en avant l'aspect "opendata" de la décision de justice. Pour Notrefamille.com, il revient juste aux départements de s’assurer au moment de la mise en oeuvre d’une licence opendata que le réutilisateur possède une autorisation de la CNIL. Et Notrefamille.com possède cette licence depuis le 24 novembre 2011 donc veut accéder aux images d'archives. Ite missa est.
Revenons un moment sur ce qu'est l'opendata. Il s'agit de données gratuites, complètes mais anonymisées, interopérables et sont produites par des services publiques. On en trouve ici une douzaine de références en France. En les parcourant on peut trouver par exemple la Comptabilisation des défunts par cimetière de la Rochelle, la liste des prénoms donnés à l'état-civil de Paris ces dernières années. Bref des données anonymisées utilisables à des fins statistiques.
Les images sont-elles des données anonymisées ? bien évidement non. Donc à mon avis le feuilleton n'est pas terminé entre Notrefamille.com et le département du Cantal



Commentaires
Bonjour,
On ne voit pas bien pourquoi l'opendata ne concernerait que les données anonymisées... Les données nominatives, point du tout anonymisées concernant, parmi d'autres nombreux exemples, les propriétaires de plaques minéralogiques, finalement vendues par l'Etat dernièrement, font parti de l'opendata. Les données généalogiques mises en ligne par la mairie de Rennes, par celle de Brest... ne sont pas anonymisées. Les données envoyées par la mairie de Paris (entre autres) à Madagascar concernant les PV de stationnement ne sont point du tout anonymisées (comment récupérer les amendes si elles l'étaient ?). Les données envoyées par la BNF, dans le cadre de Gallica (via son prestataire Jouve, ce dernier faisant, comme tout le monde, traiter ces données pour des raisons économiques en off-shore), à Dakar, concernent certes pour une large partie des données littéraires, mais aussi publiques. Rien n'est anonymisé sur Gallica que je sache ?
Les " data " sont des données publiques, point à la ligne.
On ne voit pas très bien pourquoi non plus l'opendata ne concernerait que les données utilisables à des fins statistiques uniquement. A Brest, les données mises en ligne, en accès gratuit, par la mairie concernant les décédés enterrés dans les cimetières de la ville sont bien des données généalogiques, et point du tout statistiques.
L'open data concerne toutes les données librement communicables selon la Loi, les données stats comme les données nominatives concernant des personnes décédées, ou vivantes. Le corpus légal mis en place par le Législateur européen et/ou français depuis 1978 affirme (et c'est en cela que le dernier arrêt du TA de Lyon est aussi une grande victoire pour NotreFamille.com) la libre réutilisation des données, y compris dans un cadre commercial, pour tous.
Le profil plus que très bas affiché par le Conseil Général du Cantal, publiant ce que l'on est bien obligé d'appeler un entrefilet, sur l'accord a-minima que lui apporte le TA de Lyon (le Cantal estimant la décision " satisfaisante pour les services d’archives publics, auxquels un pouvoir d’appréciation est ainsi expressément reconnu "
alors que son directeur voulait purement et simplement, en toute illégalité, interdire la réutilisation à NotreFamille, et donc aux commerciaux, et donc aux associations, et donc et particuliers...) est bien la preuve de cette victoire de NotreFamille.
http://archives.cantal.fr/?id=actua...
Pour ce qui est des données en ligne, en tenant compte des délais légaux, elles doivent être anonymisées, selon les directives de la CNIL. NotreFamille.com, il y a déjà plusieurs années (en lien avec la CNIL), s'est engagé à ne demander la mise à disposition des données que librement réutilisables selon les délais légaux et donc, dans une large mesure, ne concernant que des personnes décédées. Dont acte pour l'anonymisation qui ne s'applique plus au-delà des 120 ans réglementaires. Pour ce qui est des données pouvant impliquer des personnes encore vivantes dans les documents de plus de 120 ans ou librement communicables avant cette date (les recensements à 70 ans par exemple, mentionnant des enfants devenus adultes encore vivants aujourd'hui), NotreFamille.com a élaboré des outils logiciels permettant d'anonymiser les dites données concernant ces personnes. Dont re-acte.
Voici une saine lecture, émanant d'un spécialiste de la réutilisation des données publiques, conservateur à la BNF, et qui vous informera sur les vrais raisons - si vous savez lire entre les lignes - du refus de certains archivistes à libérer les données :
http://scinfolex.wordpress.com/2012...
Ceci étant, je suis comme vous bien persuadé que l'esprit de corps, l'acharnement à vouloir défendre certains privilèges, l'immobilisme de certains archivistes - pas tous, Dieu soit loué ! - va encore nous faire naviguer longtemps dans ce feuilleton pour la libéralisation (libération tout court) des données engagé par NotreFamille.com, libéralisation dont, il faut toujours le rappeler, nous sortirons tous gagnants.
Rebonjour,
Un mot encore, vous écrivez, péremptoirement, Guillaume : " Les images sont-elles des données anonymisées ? bien évidement non. "
La même erreur a déjà été postée il y a qq tps sur le site de la FFG.
Il faut répondre : évidemment oui ! Car s'il est un point qui détermine toute la législation concernant la réutilisation des données publiques, c'est bien que " la donnée est indépendante de son format ". En effet, la donnée publique est à la fois le contenant (la page originale du registre d'état civil ou du cahier de recensement, ou bien sa numérisation) et le contenu (les informations que l'on trouve sur ces pages).
D'où l'imbriglio juridique (en fait c'est légalement très clair) imposé par certains services d'Archives qui ne veulent en aucun cas se défaire du privilège accordé jusqu'à présent par... la coutume (on en est là !)... d'être les seuls gardiens du temple des données publiques.
L'image numérisée est bien une donnée publique, anonymisée ou non. Elle peut donc (doit donc, si l'on suit le texte de la Loi) être remise à qui en fait la demande. Y compris dans un cadre commercial.
Je précise encore pour ceux qui monteraient sur les grands chevaux de la moralisation des finances publiques dont les entreprises commerciales goujates feraient leur beurre, que dans le cas précis du Cantal, les images n'ont rien coûté à la Collectivité : les microfilms ont été effectué par les Mormons, un exemplaire remis gracieusement au département et les numérisations ayant été effectuées par la société Coutot Roehrig, par Convention de surcroît, sans appel d'offres (ce qui me semble-t-il peut être entaché d'irrégularité).
Je vous salue humblement
Bonsoir,
Comme le dit YM le problème posé est simple et compliqué!
1 les documents originaux ont ont un statut d'archives publiques et sont inaliénables! Sur ce point les services d'archives ont, et c'est pratiquement le seul, un moyen de refus formidable qui consiste à refuser de faire sortir les documents du dépôt. Mais voila c'est un terrible piège car cela limite les moyens à utiliser pour la numérisation ...
2 le travail de numérisation est une donnée qui de facto est une donnée Open-Data (donnée-ouverte) et donc tout le monde à le droit de l'exploiter. Le hic vient du fait que le travail a été fait sur des deniers publics et que certaines sociétés veulent vendre un soit-disant travail fait par elle! Nous savons tous que ce travail n'est pas fait par elle mais par des sous-traitants étrangers. Sur ce point les dépositaires de données publiques n'ont qu'un moyen de pression c'est de faire payer cette mise à disposition en cas d'utilisation commerciale. Le truc c'est que ces sociétés marchandes vont crier au scandale pour distorsion de concurrence!
Le cas du Cantal est encore plus compliqué puisque cela ne lui a RIEN coûté semble-t-il! L'absence d'appel d'offre peut être une grosse épine mais je ne le pense pas puisque le département n'aurait pas sorti 1 centime.
3 Une donnée-ouverte n'est pas obligatoirement sur un support numérique elle peut très bien restée sous forme papier! Tout travail administratif de l'état (et autres échelons) est une donnée publique. Si vous regardez de plus près l'ensemble des textes vous constaterez que l'IGN va avoir des soucis car l'ensemble de son travail va tomber dans l'escarcelle Open-Data (je ne parle pas des cartes physiques). La SNCF, La Poste ont vu l'intérêt de diffuser certaines données et vous pouvez voir ceci se développer dans le projet de cartographie libre OSM http://www.openstreetmap.org, l'2ducation Nationale à diffusé l'ensemble des établissements scolaires. Regardez la ville de Brest et son agglomération dont l'ensemble de la superficie a été cartographiée et corrigée grace aux photos aériennes mis à disposition par ces services.
Amitiés
Je persiste à croire que YM (comme d'autres) confond les "data quelconques" et les "opendata". Les opendata sont anonymisées et à vocation statistiques, les data elles peuvent être de nature diverses... La différence d'interprétation pour moi tient à ce petit point d'où l'article
Bonjour,
quoteguillaume,
Les opendata sont anonymisées et à vocation statistiques,/quote
Les « données ouvertes » (traduction libre de opendata) sont des informations publiques brutes, qui ont vocation à être librement accessibles et réutilisables (dixit Wikipedia).
Il n'a jamais été fait mention nulle part de cette notion de données « anonymisées » et encore moins de cette restriction aux seules données à vocation statistiques !
Quand aux « data quelconque » elles n'existent pas à ma connaissance ! Alors vouloir créer des catégories sorties du chapeau pour tenter de justifier le fil d'une pensée, c'est presque de la malhonnêteté intellectuelle.
quoteQu'est ce que l'Open Data?
Avant tout, il s'agit de définir l'Open Data, et de façon plus générale l'Open Knowledge. On peut déjà rassembler différentes notions (dont on pourrait traduire/franciser les noms bien qu'elles soient le plus souvent évoquées via leurs noms anglo-saxons) sous le nom d'Open Knowledge (Libre connaissance): l'Open Data (Données publiques/ouvertes), l'Open Content (Contenu libre) et l'Open Access/Services. L'Open Knowledge Foundation propose la définition suivante de "l'Open" (OKD) : une connaissance (une oeuvre, par exemple une musique, un livre, ou un film, des données, par exemple une publication scientifique, un fait historique, une donnée géographique, une information gouvernementale ou une donnée administrative) est "libre" (lire "Open" si vous êtes "adict" des anglicismes) si vous êtes libre de l'utiliser, la réutiliser et de la redistribuer, sous réserve d'en respecter la paternité et de la partager à l'identique (il y aussi d'autres subtilités comme l'absence de restriction technologique et autres que vous trouverez ici).
http://10ruegiero.wordpress.com/201.../quote
Je rejoins tout à fait le propos de « YM » qui tout comme moi ne distingue qu'une seule catégorie de données, celles dites libres qu'elles soient publiques ou privées.
Bonjour,
En effet,comme l'indique Joël, il n'y a pas de différence de définition juridique et/ou technique entre les données (data). Ces données s'inscrivent aujourd'hui dans un mouvement, celui de l'open knowledge (diffusion de la connaissance), englobant l'open data (libre diffusion des données), qu'elles soient d'origine privées et/ou publiques.
Dans le cas de nos données nominatives issues de fonds d'archives publiques, il faut vraiment commencer à s'interroger sur l'acharnement restrictif sur lequel s'arqueboutent un certain nombre d'archivistes (mais pas tous), emportant avec eux les institutions qu'ils sont censés représenter, et ainsi du même coup leur collectivité, prenant en otage les citoyens payeurs.
Le fait, comme le relève Yannick, que la numérisation entraîne des frais conséquents (et donc pourrait réduire la diffusion des données par des sociétés commerciales, entraînant des redevances payées par elles à la collectivité) ne peut être un argument. En effet, si non seulement le Cantal n'a rien payé en matière de microfilmage (les Mormons sont intervenus gratuitement ds le département) ni en matière de numérisation (la société Coutot-Roehrig a effectué la num. gratuitement), c'est le cas AUSSI pour une large majorité des départements !
Pour un début de réponse sur cette hystérie restrictive, une lecture de la réflexion d'un conservateur de Lyon peut être utile me semble t'il. Même s'il va moins loin que le conservateur de la BNF précité (qui lui implique clairement la volonté de nuire de certains directeurs d'archives), il vaut le détour... http://numeribib.blogspot.fr/2012/0...
Bonne lecture
C'est bizarre mais les licences identifiées clairement comme relevant de l'open data (ex Saône-et-Loire http://www.opendata71.fr/licence/ ou Communauté Urbaine de Bordeaux http://data.lacub.fr/license.php ) prévoient clairement que les données sont anonymisées et interdisent le croisement de données en vue de les désanonymiser cf Article 2
Bonsoir,
La « Licence information publique comprenant des données personnelles http://www.rip.justice.fr/1712-lice... est très claire et suffisante dans ce qu'il est possible de faire et ne pas faire.
Les deux exemples cités, (la Saône et Loire dans son Article 2 – Données personnelles http://www.opendata71.fr/licence/ et la Communauté Urbaine de Bordeaux dans son Article 4 - Données personnelles http://data.lacub.fr/license.php) tentent tout simplement de réduire voire d'interdire de générer des données dérivées.
Cette « Licence information publique comprenant des données personnelles http://www.rip.justice.fr/1712-lice... » stipule :
Sous réserve de mentionner la source et la date de la dernière mise à jour, de ne pas altérer les informations ni de dénaturer leur sens( art. 12 de la loi du 17 juillet 1978) , cette information est librement et gratuitement réutilisable, commercialement ou non.
Donc il me semble que si le ré-utilisateur est en conformité avec l’article 13 de la loi du 17 juillet 1978, et l'article. 12 de la loi du 17 juillet 1978, il n'est pas besoin de bricoler les licences à la sauce 71 et lacub.
Comme le signale url=[http://scinfolex.wordpress.com...]Lionel Maurel Conservateur des bibliothèques en poste à la Bibliothèque nationale de France/url
certains fonctionnaires s'arrogent le droit de légiférer sur ce droit le réutilisation des données publiques ....
Il serait temps qu'une même loi s'applique à tous partout en France.