Qunb & Datamarket : à la recherche de chiffres et graphiques

Les professionnels de l’information savent combien il peut être difficile et chronophage de trouver des informations chiffrées (données de marchés ou statistiques par exemple) sur le Web ouvert. Les méthodologies de recherche publiées régulièrement dans nos colonnes illustrent bien cette difficulté (voir par exemple «Tirer parti de la colonne d’outils de Google», Netsources n°95 et «Localiser des données de marché», Netsources n°75).

Avec l’ouverture des données publiques en France et, plus généralement, dans le reste du monde, il est devenu plus simple d’accéder aux données, mais il est souvent nécessaire d’interroger un grand nombre de sources différentes.

De plus, les données fournies sont généralement brutes et donc difficiles à réutiliser et à présenter telles quelles.

Nous présenterons dans cet article les deux services Qunb et Datamarket, qui peuvent apporter une aide précieuse dans la recherche de données chiffrées au niveau international.

QUNB : UNE INITIATIVE FRANCAISE RECENTE MAIS PROMETTEUSE

Lancé au début de l’année 2012 sur invitation en version bêta et accessible au grand public depuis l’été – mais toujours en version bêta –, Qunb (prononcez «Kju and Bi») permet d’interroger plusieurs milliers de jeux de données (l’objectif étant d’atteindre plusieurs millions de «datasets») et de présenter les informations sous forme graphique.

Le business model de cette start-up française, créée il y a deux ans par les deux ex-consultants Jean-Baptiste Théard et Cyrille Vincey, est de proposer 95 % de données gratuites – qui peuvent être issues de sources comme la Banque mondiale, Eurostat… ou être offertes par certains fournisseurs de données – et 5% de données payantes, issues de partenariats avec des éditeurs comme Euromonitor et Xerfi.

Il s’agira de «vente de données à la découpe», puisque l’internaute n’aura pas besoin d’acheter l’intégralité de l’étude, mais uniquement le jeu de données qu’il souhaite.

Au regard du tarif d’une étude complète (souvent plusieurs milliers d’euros), on peut penser que ce service intéressera de nombreux internautes

Dans une interview accordée au blogueur Jean-Michel Billaut (http://bit.ly/SZkwie), le responsable marketing de Qunb indique que le tarif n’est pas encore fixé et dépendra du type de données proposées, mais qu’il est peu probable qu’il dépasse le seuil psychologique d’une centaine d’euros par dataset.

L’interface, entièrement en anglais, est agréable et facile à prendre en main.

On dispose en premier lieu d’un moteur de recherche simple, qui permet de lancer une requête avec un ou plusieurs mots-clés.

La page de résultats affiche par défaut la liste des data series – c’est-à-dire des jeux de données provenant des différents producteurs publics ou privés – et propose également d’accéder aux visualisations pertinentes, à savoir aux graphiques créés par des utilisateurs de Qunb – qui sont principalement, à l’heure actuelle, des membres de l’équipe de Qunb et quelques bêta-testeurs –.

La liste des jeux de données propose pour chacun un résumé du contenu et des tags (source, unit et unit group), sur lesquels il est possible de cliquer pour les inclure dans la recherche.

En cliquant sur un jeu de données, on accède à un graphique qu’il est ensuite possible de modifier selon différents critères – type de graphique (en colonnes, lignes, camembert...), unité, période, pays, etc –.

L’un des atouts de ce service réside dans le fait qu’il est possible de comparer plusieurs jeux de données entre eux en les réunissant au sein d’un même graphique.

Pour ce faire, il suffit de cliquer sur « Add more data » lorsqu’on se retrouve sur un jeu de données et d’entrer sa nouvelle recherche.

Le nouveau jeu de données sélectionné viendra s’ajouter au graphique, qui peut être sauvegardé, publié et partagé.

Si l’on ne souhaite pas utiliser le moteur, on peut également naviguer parmi les données par rubriques et sous-rubriques, à partir de dix catégories principales : Media, Science, Technology, Environment, Business, Food and Beverage… Mais lors de nos tests, de nombreuses catégories ne contenaient aucun jeux de données.

De par son caractère récent, Qunb n’est pas encore totalement au point, notamment pour la recherche par mots. Nous avons en effet rencontré un certain nombre de dysfonctionnements lors de nos tests, lorsque la requête portait sur plusieurs mots-clés...

Mais l’outil est encore jeune, et dispose d’un réel potentiel pour le futur. Il devrait d’ailleurs quitter sa version bêta d’ici la fin de l’année. Notons également que la société travaille à l’amélioration de la recherche et de la visualisation et qu’une application mobile sous Android est déjà disponible et le sera bientôt sur IOS.

DATAMARKET.COM : POUR EXPLORER, VISUALISER ET PUBLIER DES DONNEES

Datamarket n’est pas novice et évolue dans la cour des grands aussi bien en termes de contenu que de fonctionnalités. Datamarket est en effet un service islandais, lancé en juin 2008.

A l’origine, il se concentrait exclusivement sur des données nationales islandaises mais depuis le début de l’année 2011, le site a pris un tournant décisif en proposant des données plus internationales et en ouvrant un bureau aux Etats-Unis.

Le site propose des milliers de jeux de données (près de 29 000 à l’été 2012). La majorité sont accessibles gratuitement (environ 26 000), mais certaines données (environ 3 000) sont payantes et leur prix peut parfois s’avérer élevé.

On peut y chercher toutes sortes de données, les visualiser sur un graphique, les comparer avec d’autres données et les télécharger au format de son choix (pdf, image, svg, xls, excel data url, csv et tsv).

A ce jour, on recense 74 fournisseurs de données ; cela étant, plus de la moitié sont des fournisseurs islandais et leurs données ont peu de chances d’intéresser les professionnels de l’information français.

Parmi les fournisseurs internationaux, on pourra citer BP (nombreuses données gratuites sur la production de pétrole par pays, la consommation de gaz dans le monde…), EIU (données payantes dont le tarif minimum est de 619 $ par an), Eurostat, Gapminder Foundation (données sur l’âge au premier mariage par pays par exemple), le FMI, les Nations-Unies, la Banque mondiale, la Fifa (données sur les résultats des coupes du monde), Pew Research Center, Wikileaks (1 seul jeu de données sur les morts et blessés en Afghanistan), Wikipédia (1 seul jeu de données sur les médailles aux jeux olympiques) ou encore The Guardian (données sur les condamnés à mort et les exécutions dans le monde).

Au niveau de la recherche, on dispose d’un moteur simple accessible depuis la page d’accueil.

Le moteur affiche des suggestions au fur et à mesure de la saisie des mots-clés, qui sont séparés implicitement par un AND. Le NOT (représenté par un tiret) et les guillemets pour une expression exacte fonctionnent ; en revanche, il est impossible d’utiliser l’opérateur OR.

Une fois la liste des résultats affichés, on dispose d’un grand nombre de filtres dans la colonne de gauche, parmi lesquels :

• type de données : jeux de données ou «topic page», correspondant à une compilation de données effectuée par Datamarket ou des internautes ;

• prix : gratuit ou payant ;

• fournisseur de données ;

• tag : chaque jeu de données est tagué avec un grand nombre de mots-clés relatifs à la thématique abordée, comme par exemple Income, Demographics, Public Transport, etc ;

• langue : anglais, allemand ou islandais ;

• granularité : données annuelles, mensuelles, trimestrielles…

• et année.

En cliquant sur un jeu de données, on accède à une interface personnalisable où l’on peut choisir les données à intégrer au graphique ou tableau. On pourra par exemple effectuer une sélection de pays à afficher, puis cliquer sur «Visualize». On peut ensuite changer le type de graphique (colonnes, lignes, tableaux, etc), rajouter manuellement des marqueurs temporels sur le graphique et finalement exporter les données au format de son choix.

Pour comparer plusieurs jeux de données entre eux, il suffit de cliquer sur «Add data » en bas à droite de la colonne de gauche, puis rechercher et ajouter un ou plusieurs autres datasets.

On peut également explorer les jeux de données sans utiliser le moteur de recherche, en se rendant dans l’onglet «Explore data». On a alors la possibilité de consulter des statistiques par pays, industrie, fournisseur de données, «topic pages», données récemment mises à jour et « highlights ».

Le fonctionnement de Datamarket est on ne peut plus simple et le résultat est esthétique et facilement réutilisable (ce qui change par rapport à certains fournisseurs de données comme Eurostat par exemple, dont l’interface n’est pas des plus conviviales).

On peut donc sans hésitation ajouter ces deux sites à ses signets ; s’ils ne sont pas exhaustifs en termes de couverture, ils peuvent néanmoins faire gagner un temps précieux aux professionnels en quête de données chiffrées, statistiques et graphiques.



Carole Tisserand-Barthole
Publié dans le n° 99 de Netsources (Juillet-Août 2012)

Aucun commentaire:

Enregistrer un commentaire