Data-Publica.com : le portrait français des données publiques et de l'open data

Al’origine de Data Publica, on trouve un projet de R&D mené par François Bancilhon, partiellement financé par l’appel à projet web innovant du Secrétariat d’état à l’économie numérique, qui se concrétisera par la création du premier annuaire de données publiques françaises en 2010.
    

En 2011, François Bancilhon, cette fois-ci accompagné de Christian Frisch, décide de lancer une société pour exploiter les données.
   
Data Publica propose aujourd’hui un très grand nombre de données publiques françaises, quelques données payantes (fournies par des entreprises et associations ayant choisi de vendre leurs données par ce biais) et un service de fourniture de données sur mesure.
   

Nous nous intéresserons ici aux deux premiers aspects.
    

A ce jour, on y dénombre près de 13 000 jeux de données.
    

La très grande majorité des données sont accessibles gratuitement ; seuls 55 «sets» sont disponibles en accès payant (pouvant aller de quelques dizaines à quelques milliers d’euros).
    

Les données gratuites proviennent de multiples sources dont Eurostat, les différents ministères, la Banque de France, l’Insee, France Agrimer, le Comité national routier, la  Caisse des allocations familiales, des observatoires régionaux des transports ou encore le Club des villes et territoires cyclables…

Elément intéressant, Data Publica a intégré toutes les données de Data.gouv.fr (voir Bases n°287, novembre 2011).
    

Du côté des données payantes, on trouve pour le moment cinq organismes : J++ (qui propose des données sur les comportements de votes des français), G2Plus (avec des chiffres sur les procédures collectives), Public Evaluation System (l’agence de notation des collectivités locales françaises), l’Adepale (Association des entreprises de produits alimentaires élaborés), E-BDD (proposant des données diverses et variées sur les marques et modèles de motos, les races d’animaux domestiques ou encore une Base ISBN et EAN13 des livres francophones...) et Mesagraph, avec un set de données sur les primaires socialistes sur Twitter.
    

Quant aux données gratuites, elles couvrent aussi bien les campings classés en Midi-Pyrénées que la démographie des infirmiers à l’horizon 2030.
    

Pour identifier des données, on dispose d’un moteur de recherche sur la page d’accueil ou de la possibilité de naviguer par catégories, via la rubrique «Explorer les données».
    

En matière de fonctionnalités de recherche, le moteur se limite au minimum : mots-clés séparés par un ET par défaut.
 

L’utilisation du – pour exclure un mot semble fonctionner ; en revanche, aucune trace de l’opérateur OR ou des guillemets pour la recherche d’expression exacte.
    

Après avoir lancé une requête, on accède à la liste des résultats, que l’on peut encore filtrer : par prix (gratuit ou payant), par catégorie (économie/finance, environnement & énergie, travail & salaires, transports & logistique…), par type de publication (feuille de calcul, CSV, PDF, XML, RDF ou autres), par éditeur et par type de licence (licence ouverte, licence data publica…).
    

Depuis peu, le site propose un outil de visualisation baptisé «Dataviz», disponible pour une centaine de jeux de données seulement.
    

On y accède depuis la colonne de filtre en choisissant «datavisualisation» dans la rubrique «type de publication».
    

Après avoir sélectionné un jeu de données, on peut alors choisir de les visualiser via une carte, un histogramme, des courbes ou des tableaux. Et le résultat est très intéressant !
    

Pour les données sur les «diplômés de l’enseignement supérieur» par exemple, on peut choisir de comparer sous formes de courbes le nombre de nouveaux diplômés par an entre la France, l’Allemagne et le Royaume-Uni.
    

Data Publica est indéniablement un site incontournable pour toute personne en quête de données publiques.
    

La diversité des sources est intéressante, même si elle est encore limitée pour ce qui est des données payantes.
    

Espérons que d’autres entreprises choisiront de passer par ce biais pour vendre leurs données.
    

On remarquera d’autre part que, si Data Publica est à notre connaissance le site le mieux fourni en matière de données publiques, il n’est pas pour autant exhaustif.
    

Nous avons par exemple cherché à savoir si les données présentes sur les plateformes d’open data mises en œuvre par certaines villes ou régions (Rennes, Paris, Toulouse, Nantes… voir Bases n°286, octobre 2011) se retrouvaient toutes sur Data Publica.
    

Les tests effectués ne nous ont pas permis de retrouver les données de la plateforme OpenData Grand Toulouse par exemple ; nous avons néanmoins réussi à trouver quelques données de la plateforme Opendata de Rennes (les données de Keolis Rennes pour les transports notamment).
    

Il faudra donc penser à aller interroger d’autres sources lorsque l’information ne se trouve pas sur Data Publica.
   

INFORMATION

www.data-publica.com

 

Carole Tisserand-Barthole
Publié dans le n° 289 de Bases (Janvier 2012)

Aucun commentaire:

Enregistrer un commentaire