Les professionnels de l’information sont souvent à la recherche de données chiffrées, qu’il s’agisse de données financières, de tarifs, de statistiques, de données douanières, de taille ou capacité de production d’usines, de données démographiques, de données géographiques, etc.
Ces données souvent cruciales ne sont pas simples à identifier et éparpillées à travers le Web sur une grande diversité de supports.
Dans ce numéro de NETSOURCES, nous avons choisi de nous intéresser exclusivement aux données chiffrées et de faire le point sur ce type de recherche un peu particulier :
Quelles sont les grandes sources proposant des statistiques et données chiffrées qu’il faut impérativement connaître ?
Comment rechercher des données directement sur les moteurs de recherche, les médias sociaux, etc. ?
Comment identifier les sources les plus à même de détenir les données que l’on souhaite obtenir ?
Quelles sont les spécificités de la recherche de données financières ? Quelles sont les principales sources à connaître ?
Comment tirer parti des outils d’extraction de données pour gagner du temps face à de gros volumes de chiffres pour la phase d’analyse et de capitalisation des informations ?
Qu’il s’agisse de trouver des données macro-économiques, des statistiques, des données démographiques, etc., il est souvent préférable de débuter avec des sources et outils spécialisés sur ce type de données , comme nous avons pu le voir dans le précédent article « Méthodologie et outils pour la recherche de statistiques».
Malheureusement, ces grandes sources ne permettent pas toujours de répondre à l’ensemble des besoins informationnels. Des moteurs de recherche classiques peuvent guider l’internaute vers les données dont il a besoin ou bien il faut se tourner vers des sources bien plus spécialisées.
Dans cet article, nous aborderons la question de la méthodologie à adopter pour chercher et trouver des données chiffrées sur le Web.
La recherche d’informations financières concernant une entreprise est un exercice dont le niveau de difficulté et le coût peuvent assez vite déraper en fonction du contexte et des enjeux. Tout professionnel de l’information, veilleur ou analyste, en fait souvent l’expérience dans sa collaboration avec ses clients dans les directions de stratégie, marketing, finances/acquisitions, compliance…
Quel que soit le champ et la profondeur de l’investigation à mener et les moyens employés, la recherche de données financières est toujours un défi et un parcours semé d’embûches pour le chargé de recherche, avec parfois, in fine, l’incapacité de parvenir à des certitudes, faute de données et de possibilités de recoupement suffisantes.
Car c’est la quête de cette certitude, condition sine qua non de la fiabilisation des analyses et décisions ultérieures, qui constitue à notre sens la difficulté de la recherche de données financières. Plus que cela, elle doit constituer le driver essentiel du chargé de recherche.
Lors de recherches ou de veilles sur le Web, il n’est pas rare de rencontrer des documents ou des pages Web comportant un gros volume de données chiffrées que l’on souhaite récupérer. Il peut s’agir par exemple de tableaux sur un site internet, d’informations au sein d’un fichier PDF protégé, etc.
Malheureusement, il est souvent impossible de copier-coller l’ensemble de ces données de façon simple et rapide.
S’ensuit alors une longue séance de Ctrl C-Ctrl V pour extraire manuellement les informations utiles... Mais ce temps peut être considérablement réduit grâce à un outil d’extraction de données.
Nous détaillerons dans cet article les différents types d’outils existant sur le marché et les méthodes communes pour les utiliser. Mais avant cela, il convient de définir ce que sont les données structurées et non structurées.