Article “les pirates de l’informatique” : OpenData - Partie 1


#1

Je vous soumets la première partie du projet d’article (plan et discussion : Article “les pirates de l’informatique” : OpenData). Désolé ça risque d’être indigeste sans la mise en forme :smile:


OpenData : levier de transformation de la société


L’ouverture des données ou OpenData est un mouvement récent initié principalement par les gouvernements depuis les années 2000 mais qui s’appuie sur une des briques essentielle dans nos sociétés numériques : les données. L’objectif étant à terme de permettre, en vrac, une plus grande transparence des décisions politiques, la création de nouveaux services, l’émergence de villes plus « intelligentes », etc. commençons par explorer le monde des données ouvertes et ces applications pratiques.


Historiquement le droit d’accès à l’information publique est un préalable posé par l’article XV de la Déclaration des Droits de l’Homme et du Citoyen qui précise : « La société a le droit de demander compte à tout agent public de son administration. ». Sans rentrer dans les détails juridiques, si le mouvement d’ouverture des données publiques en France date de 1978, un coup d’accélérateur a été donné à l’Open Data par la loi du 7 octobre 2016 pour une République numérique, dite Loi Lemaire, qui consacre l’ouverture par défaut des données « disponibles sous forme électronique » que les administrations doivent mettre à disposition en ligne « dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé ». Dans les faits toutes les ministères, autorités administratives, et collectivités territoriales [communes, communautés de communes, métropoles] de plus de 3 500 habitants et de plus de 50 agents sont soumis à cette nouvelle obligation, et même si certains sont en retard le mouvement d’ouverture des données est en plein essor actuellement, même certaines entreprises s’y mettent !

Mais de quoi parle-t’on ? Les données forment la base d’une pyramide à trois étages : les données permettent de générer de l’information qui elle-même permet de bâtir de la connaissance. Pour reprendre une analogie courante : les données sont les prix, images, tarifs, activités, critiques que vous pouvez collecter sur une destination, cette collecte et leur agencement va vous permettre de vous informer sur chacune des destinations possibles en fonction de votre contexte (partir en vacances par exemple), ce qui va vous permettre de faire un choix en fonction de paramètres qui vous sont propres. Le mouvement de l’Open Data vise à permettre l’étude, l’utilisation, la modification et le partage des données, même à des fins commerciales, ce qui rejoint pleinement la culture libre en particulier les « Savoirs Libres » (http://opendefinition.org) dont les valeurs sont portées depuis 2004 par l’Open Knowledge Foundation.

NOTE : Manque la pyramide : https://vitaloweb.org/2017/01/26/trop-informations-pas-assez-de-connaissances-prise-de-decision-pyramide-connaissance/

De la même manière que pour les logiciels libres, pour que les données soient ouverts, une licence doit en autoriser l’accès, l’utilisation et le partage. Actuellement en France les deux licences les plus utilisées sont la Licence Ouverte (LO) très permissive, créée par l’État français via la mission Etalab, et l’Open Database License (OdbL) qui oblige les réutilisateurs à ouvrir le résultat de leur travail, ce qui correspond au modèle viral de certaines licences pour les codes sources des logiciels comme la licence GNU General Public Licence (GNU-GPL). Pour en savoir plus sur ce sujet précis, rendez-vous sur la page dédiées aux licences de réutilisation : https://www.data.gouv.fr/fr/licences.

Enfin afin de permettre l’interopérabilité et la combinaison de différents jeux de données, les données ouvertes doivent être disponibles sous une forme directement traitable de manière automatisée. Tim Berners-Lee, principal inventeur du Web est à l’origine de la définition des 5 étoiles de l’Open Data (http://5stardata.info/fr) qui hiérarchise les données sous licence ouverte : du fichier PDF, noté une étoile, aux données ouvertes liées (Linked Open Data), noté 5 étoiles. De plus ces données peuvent non seulement avoir un format tabulaire (ex. : CSV), hiérarchique (XML / JSON), en réseau (RDF) ou géographique (GeoJSON) mais peuvent être mises à jour périodiquement ou disponibles en temps réel via API par exemple. Afin de faciliter l’accès et la compréhension de ces données ouvertes la plupart des producteurs utilisent des plateformes mutualisées afin de contextualiser leurs données notamment grâce à l’ajout de méta-données. Ces plateformes sont souvent locales, par exemple pour la région Provence Alpes Côte d’Azur avec DataSud (https://www.datasud.fr), leurs données sont ensuite moissonnées au niveau national (https://www.data.gouv.fr) puis au niveau européen (https://www.europeandataportal.eu). Le site Open Data Monitor (https://opendatamonitor.eu) permet d’avoir une vue globale et qualitative de ces plateformes au niveau européen, et accessoirement de trouver de la matière première !


#2

J’aime bien et j’ai appris des choses.
On peut te faire des remarques sur la forme ?


#3

Martyrise :slight_smile:


#4

En fait, c’est juste le dernier paragraphe :

Enfin , dans le but de permettre l’interopérabilité et la combinaison de différents jeux de données, les données ouvertes doivent être disponibles sous une forme directement traitable de manière automatisée. Tim Berners-Lee, principal inventeur du Web est à l’origine de la définition des 5 étoiles de l’Open Data (http://5stardata.info/fr) qui hiérarchise les données sous licence ouverte : du fichier PDF, noté une étoile, aux données ouvertes liées (Linked Open Data), notées 5 étoiles. De plus, ces données peuvent non seulement avoir un format tabulaire (ex. : CSV), hiérarchique (XML / JSON), en réseau (RDF) ou géographique (GeoJSON) mais aussi être mises à jour périodiquement ou disponibles en temps réel via API par exemple. Afin de faciliter l’accès et la compréhension de ces données ouvertes , la plupart des producteurs utilisent des plateformes mutualisées qui contextualisent leurs données notamment grâce à l’ajout de méta-données.

J’ai enlevé 2 passages et j’ai modifié 3 autres.
Pour les formats, je trouve que ça fait lourd dans la phrase. Soit les placer en note de bas de page, si c’est possible, soit faire une nouvelle phrase qui les liste et les explique.


#5

Avant même de lire, j’ai tiqué sur le graphique :no_mouth:
Le fait de trouver le format EXEL(donc proprio et fermé) entre deux format un vaguement ouvert(pour le PDF) et un ouvert(pour le CSV) ça me bloque …

Mais bon … je comprend l’idée, à savoir le degré d’exploitabilité de l’information…

Tu saurais traduire rapidement (et vérifier) ce que signifie les lettres du graphique s’il te plaît ? Il m’en manque :
OL
RE
OF (open format ?)
URI (uniforme resource identifier ?)
LD (linked data ?)


#6

De tête c’est :

OL = OnLine
RE = (machine)-REadable

Pour les autres tu es bon.