Data.gouv.fr : à l'assaut des données publiques de l'Etat

Nous en parlions dans le dernier numéro de Bases («Les initiatives françaises en matière d’Open Data»), l’Etat français préparait depuis plusieurs mois son portail de données publiques, avec une ouverture prévue pour la fin de l’année.

C’est aujourd’hui chose faite : le lancement de Data.gouv.fr a bien eu lieu le 5 décembre dernier.
  
En terme esthétique, le portail est simple et épuré avec des petites touches de couleurs aux accents patriotiques. On y trouve à ce jour plus de 352 000 jeux de données provenant de 90 producteurs, parmi lesquels on pourra citer l’administration du premier ministre, de nombreux ministères (ministère des Affaires étrangères, de la Défense, de l’Ecologie, de l’Intérieur, etc), le CSA ou encore l’IGN, l’Insee, RFF et la SNCF.
   

Pour rechercher les données, on dispose d’un moteur  développé par Exalead, accessible sur toutes les pages. Les termes de la requête sont séparés implicitement par un AND et l’on peut également utiliser les opérateurs OR et NOT (représenté par un tiret), ainsi que les guillemets pour la recherche d’expression exacte.
  
Le moteur ne semble pas sensible aux accents ni aux majuscules et élargit visiblement la recherche aux formes proches d’un mot (une recherche sur «élève» ramène par exemple des résultats avec «élèves» au pluriel).
  
Sauf que malheureusement, rien de tout cela n’est expliqué dans une aide ou un guide d’utilisation quelconque. 
  
On notera également que le moteur propose des suggestions au fur et à mesure de la saisie.
  
Une fois les résultats affichés, on peut aisément affiner la requête dans la colonne de droite. Il est possible de filtrer par mot-clé (le choix est très grand), par année (1905-2011), par format (très majoritairement en xls), par producteur de données (on constate à cette occasion que l’Insee est de très loin le premier fournisseur de données de la plateforme, avec 293 826 jeux de données, soit plus de 80% du contenu) et par couverture (nationale, par région ou par département).
  
Une grille de recherche avancée est également proposée et permet d’effectuer la recherche sur les champs «producteur de données», «couverture géographique» ou «thématique».
  
Parmi les données disponibles, on peut trouver par exemple des informations aussi variées que le nombre d’élèves apprenant le latin et/ou le grec dans le second degré pour l’année 2009/2010, le nombre d’immatriculations de véhicules neufs par an (de 1993 à 2009), les délits constatés par les forces de l’ordre en 2008 classés par département et par type de délit, ou encore la liste des gares de frêt avec leur localisation géographique fournie par RFF.
  
Ce dernier élément est d’ailleurs fort intéressant puisque nous avions cherché à obtenir cette information il y a de cela à peine un an dans le cadre d’une recherche documentaire et, qu’après de multiples tentatives pour contacter un responsable chez RFF, il nous avait finalement été signifié que l’entreprise ne diffusait pas ce genre d’informations. Les temps changent…
  
Le lancement de Data.gouv.fr est donc une excellente nouvelle pour les professionnels de l’information – mais également pour tous les citoyens – et un pas supplémentaire vers l’ouverture des données publiques françaises. Mais la route est encore longue…
  
Le nombre de données présentes sur le portail devrait doubler au cours de l’année 2012 ; il faut néanmoins espérer que ces nouveaux ajouts ne proviendront pas uniquement de l’Insee !
  
Rappelons d’ailleurs que la diffusion des données de l’Insee est loin d’être une nouveauté, puisqu’on pouvait déjà les retrouver depuis de nombreuses années sur leur site.
  
On peut enfin s’interroger sur le choix du format des données, très majoritairement Excel, un format propriétaire qui n’a rien de très «open».
  
Signalons d’autre part que depuis la rédaction de l’article «Les initiatives françaises en matière d’Open Data», deux nouvelles plateformes ont également vu le jour : Nantes Ouverture de données (http://data.nantes.fr/) et Pilote41, la plateforme de l’information territoriale du Loir-et-Cher (www.pilote41.fr/).



Carole Tisserand-Barthole
Publié dans le n° 287 de Bases (Novembre 2011)

Aucun commentaire:

Enregistrer un commentaire