Quand on recherche de l’information sur le Web, on a souvent l’impression que tout ce qui a, un jour, été publié sur le Web ouvert doit pouvoir se retrouver d’une manière ou d’une autre, notamment en tirant parti des fonctionnalités avancées des moteurs de recherche comme Google. Or l’information sur le Web ouvert est bien plus éphémère qu’on ne pourrait le croire...
Dans la réalité, une très grande partie de ce qui a été publié sur le Web dans les années 1990 et 2000 n’existe plus en tant que tel. Les sites Web ont été refaits ou ont tout simplement disparu. Et de fait, bon nombre de ces contenus sont désormais inaccessibles par les moteurs de recherche classiques.
La recherche d’articles de presse est un exercice classique pour les professionnels de l’information.
Pour autant, s’il existe de multiples outils et méthodes pour retrouver en ligne le contenu textuel d’articles parus dans des revues et journaux papier, cela s’avère nettement plus compliqué lorsque l’on souhaite retrouver les articles avec leur mise en page originale.
Il existe aujourd’hui de multiples manières de rechercher de l’information et cela ne se limite plus à l’insertion de mots-clés dans une boîte de recherche : on peut utiliser des images, des sons, des blocs de texte, tirer parti de recommandations automatiques, etc.
Les grands moteurs de recherche Web comme Google et Bing notamment, dont le développement se focalise toujours un peu plus vers la recherche mobile et vocale ont fait évoluer la façon dont il est possible de les interroger. Et le recours à l’intelligence artificielle chez ces mêmes moteurs permet d’ailleurs une meilleure compréhension de l’intention de l’utilisateur et par là-même une simplification potentielle des requêtes.
Rechercher sur le Web classique est une chose ; effectuer des recherches sur les réseaux sociaux en est une autre.
Si les moteurs de recherche classiques comme Google et Bing sont adaptés à la recherche sur les sites Web tels que les sites d’entreprises, sites institutionnels, sites d’actualités, blogs, forums, ils ne sont pas d’une très grande utilité lorsque l’on souhaite obtenir des résultats issus de réseaux sociaux comme Twitter, Facebook, Instagram, Pinterest ou encore LinkedIn.
Quand on dispose de la référence bibliographique d’un article scientifique, il n’est souvent pas très difficile d’identifier et d’obtenir l’article en texte intégral même si cela a un coût.
Dans la majorité des cas, une simple recherche sur le titre de l’article dans un moteur de recherche généraliste, comme Google ou Bing, ou dans un moteur de recherche académique, comme Google Scholar, permet d’identifier rapidement le PDF de l’article en ligne, qu’il soit accessible gratuitement ou de façon payante sur le site de l’éditeur.
Les études de marché offrent une forte valeur ajoutée car elles associent à la fois un travail de compilation de données précieuses et une analyse approfondie.
Mais elles ont la réputation d’être chères, très chères même. Faut-il pour autant faire une croix sur ces sources si l’on ne dispose pas d’un budget suffisant ou d’un accès aux principales sources et bases de données qui en proposent?
Dans un article publié sur notre blog « Google évolue : les documentalistes plus utiles que jamais », nous faisions le constat que Google affiche toujours moins de résultats et ce, quelle que soit la requête et alors que son index ne cesse pourtant de s’accroître.
Il annonce certes dans un premier temps des centaines de milliers voire des millions de résultats mais en se rendant sur la dernière page de résultats, on constate que leur nombre ne dépasse pratiquement jamais les 500.
Pour preuve, nous avions réalisé en 2011 une recherche sur les masques respiratoires. A l’époque, une requête sur l’expression masque respiratoire permettait de visualiser plus de 1 000 résultats dans Google. Aujourd’hui, la même requête n’en génère que 183.
On voit paraître régulièrement sur le Web et dans la presse des études et sondages sur les pratiques informationnelles des internautes sur le Web et les médias sociaux.
Un rapport du sérieux Pew Research Center publié cet été sur l’usage des médias sociaux dans l’accès à l’information montrait que 67% des américains s’informaient via les réseaux sociaux (Twitter, Facebook, Instagram, Whatsapp) et la moitié d’entre eux sur Facebook.
Les médias traditionnels n’en étaient pas pour autant délaissés mais perçus comme un complément. Cette tendance ne s’applique d’ailleurs pas qu’aux américains mais bien à travers le monde entier.
On ne le répétera jamais assez mais se former en permanence à de nouvelles compétences est une qualité essentielle des professionnels de l’information.
Mettre à jour ses connaissances en veille, recherche d’informations ou tout autre sujet relatif à l’infodoc est bien évidemment indispensable, mais il serait dommage de s’y restreindre et de ne pas aller explorer des domaines annexes (formation, communication, etc.).
Cette idée d’article nous avait été suggérée par un visiteur d’un précédent salon i-expo qui nous avait expliqué les difficultés à identifier des formations dès lors que l’on sort du champ traditionnel de l’infodoc.
Quand on pense recherche d’information et veille, on pense généralement au texte et moins à l’image. Dans l’imaginaire collectif, la recherche de contenus visuels renvoie davantage à l’iconographie et aux applications grand public qu’à un usage professionnel. Le lien entre les images et la veille concurrentielle et stratégique n’est pas une évidence...
Les outils du Web dédiés aux images (moteurs de recherche, bases de données, réseaux sociaux) ne sont pas nouveaux mais ils ne cessent de se multiplier et de se perfectionner. Le développement de l’intelligence artificielle y est pour quelque chose.
D’autre part, on remarque ces derniers temps une tendance prenant toujours plus d’ampleur : la recherche visuelle. On ne cherche plus seulement des images à partir de contenu textuel (mots-clé) mais l’image elle-même peut devenir le point de départ de la recherche en lieu et place des mots-clés.
Scopus est un agrégateur de références d’articles scientifiques qui propose 69 millions de références issues de 22 000 publications de plus de 5 000 éditeurs.
L’accès au service est payant, le modèle étant celui du forfait annuel souscrit par des Universités, des entreprises…
Outre l’accès payant, Scopus offre un service gratuit d’identification d’auteur, basé, bien sûr, sur l’ensemble de son fonds.
La presse est une des sources d’information clé pour la veille et la recherche d’information.
Pour interroger la presse que ce soit pour la France ou à l’étranger, on pense généralement aux solutions suivantes :
. consulter directement les sites des titres de presse
. effectuer une recherche sur Google Actualités
. ou encore interroger les agrégateurs de presse qui agrègent des dizaines de milliers de titres et proposent une interface avec des fonctionnalités de recherche avancées et expertes comme Factiva, Pressedd, Europresse, Nexis, etc.
Nous avons effectué récemment une recherche dans la presse française sur les tiques, des acariens plutôt désagréables, responsables en particulier de la transmission de la maladie de Lyme.
Pour chercher dans la plus large couverture de la presse française, nous avons utilisé Pressedd.
A notre surprise nous avons trouvé, pour la période du 1er au 30 juin 2017, 1 343 réponses, incluant d’éventuels doublons, de même que des articles identiques publiés dans différentes éditions de quotidiens régionaux.
Nous avions consacré la Une du dernier numéro de NETSOURCES à la recherche d’information appliquée aux personnes.
Cet article portait sur un aspect spécifique : la recherche et la veille sur des personnes dont on connaît le ou les noms (dans le cadre d’une démarche de e-réputation, de réalisation de biographies, de vérification d’informations sur une personne, ou pour retrouver des déclarations).
Cette fois-ci, nous allons aborder l’autre pendant de la recherche d’information sur les personnes : l’identification d’experts, d’influenceurs, ou de talents répondant à des critères précis.
Le processus de veille s’appuie dans bien des cas sur une collecte multi-supports, impliquant une large variété de sources.
Cependant, une grande partie des informations est retrouvée dans des sources d’information de type presse/actualités qu’on peut classer globalement en deux grandes catégories de supports.
Il n’est pas rare d’être confronté à la recherche d’informations sur des personnes et les problématiques rencontrées peuvent être multiples : identification d’un potentiel candidat à un poste ou vérification des informations le concernant, renseignements sur les dirigeants d’une société, etc.
Malgré cette diversité, la question de la veille et de la recherche d’information appliquée aux personnes mérite d’être étudiée dans son ensemble car il existe des similitudes dans l’approche et la méthodologie même si les sources et les outils peuvent différer.
Dans le cadre d’une veille, il n’est pas rare de voir remonter des contenus qui n’ont en réalité rien de nouveaux et ont été publiés il y a plusieurs années. Et dans un monde où tout s’accélère, bon nombre de contenus deviennent très vite obsolètes.
Reprenez par exemple un article datant de 2008/2009 sur les lecteurs de flux RSS ou un article sur le marché des moteurs de recherche avant l’arrivée de Google et vous verrez à quel point le paysage a changé et que les informations publiées sont d’une utilité quasi-nulle à part dans une démarche historique.
Les start-ups ont le vent en poupe et sont un moteur de l’innovation en France comme à l’étranger. A une époque que l’on peut qualifier de disruptive, la plupart des entreprises, quels que soient leur taille et secteur, font des efforts significatifs pour appréhender les fortes et parfois brutales percées et évolutions technologiques susceptibles d’impacter leurs produits ou services.
Acteur important et témoin de cette (r)évolution permanente, la start-up est donc un élément fondamental à suivre pour toute entreprise désireuse de se développer dans son secteur d’activité.
Le veilleur doit donc désormais intégrer à son spectre de surveillance et de recherche le suivi des start-ups.
Le recours à des infographies pour présenter des données ou illustrer des articles, documents ou rapports s’est multiplié au cours des dernières années.
Rappelons qu’« une infographie est une présentation visuelle et ordonnée d’un sujet généralement complexe. Le but initial d’une infographie est de faire comprendre par l’image. L’infographie se présente souvent comme une longue affiche que l’on parcourt de bas en haut en faisant défiler l’écran » (source : www.definitions-marketing.com).
Derrière les concepts de veille concurrentielle et de veille stratégique se cachent des réalités très diverses en fonction du secteur d’activité dans lesquelles elles s’exercent.
Dans l’industrie par exemple, la surveillance des usines des concurrents revêt un caractère crucial.
Elles ne représentent certes pas la partie la plus visible de l’entreprise, bien au contraire, mais sont au cœur des opérations et la recherche de tous types d’informations sur leur fonctionnement (production, éléments financiers, approvisionnement…) est essentielle dans l’analyse d’une société ou d’un groupe.
Quand on pense recherche d’informations ou veille, ce qui vient en premier lieu à l’esprit pour identifier ou interroger des sources, c’est souvent la stratégie suivante :
. recherche sur le Web sur le sujet et notamment sur Google
. interrogation et surveillance des médias sociaux pour repérer des informations et des sources non trouvées sur le Web
. interrogation des grandes sources d’informations payantes comme les agrégateurs de presse ou les bases de données professionnelles (Factiva, EBSCO, etc) qui permettent d’accéder à une grande partie des informations payantes sur le Web.
La conférence s’est conclue par un passionnant tutoriel d’une durée d’ … 1h30 donné par le Dr Gabriele Kirck-Verfuß du cabinet allemand WissensWert. L’objectif était de comparer une recherche par mots-clés effectuée de façon professionnelle avec les résultats d’une approche sémantique.
Dans la première partie de ce tutoriel nous avons trouvé particulièrement intéressante la présentation de nombreuses sources permettant d’enrichir le vocabulaire et le contexte décrivant, essentiellement en anglais, mais pas uniquement, chacun des concepts utilisés dans la recherche.
Retrouver les dernières déclarations d’une personnalité, rassembler les discours parus dans la presse sur une thématique précise, … voici des problématiques auxquelles peuvent être régulièrement confrontés les professionnels de l’information.
Pourtant, cette entreprise n’a rien d’aisé, loin de là. Même si les déclarations sont souvent mises entre guillemets et/ou en italiques dans les textes et articles qui les relatent, il n’existe pour autant aucun moyen simple et direct pour identifier ces éléments, que ce soit en utilisant des moteurs de recherche ou des bases de données et agrégateurs de presse.
On reconnait bien souvent un professionnel de l’information à son utilisation intensive et souvent experte des opérateurs booléens et autres opérateurs avancés.
Chaque question est ainsi décortiquée, traduite en une liste de mots-clés avec leurs variantes et synonymes et combinés entre eux avec des opérateurs booléens et de multiples opérateurs avancés (termes dans la même phrase, termes cités au moins n fois, opérateurs de proximité, etc.).
Les autres professions ont quant à elles généralement tendance à méconnaître ces différentes fonctionnalités et à préférer des requêtes en langage naturel.
L’information scientifique et technique est importante pour une structure de type centre technique. Il est donc nécessaire de remettre périodiquement en cause ses sources d’informations en choisissant le meilleur compromis entre la qualité et le coût.
En 2016, le CETIM a cherché à évaluer la pertinence de ses sources d’informations. Celles-ci ont en effet évolué depuis quelques années, en particulier avec l’apparition de l’offre des éditeurs scientifiques. Le département Veille Technologique et Stratégique du CETIM s’est appuyé sur un projet de fin d’année de Licence Pro en info-doc de Lyon pour évaluer la pertinence des différentes sources d’information.
« Avoir un coup d’avance », anticiper, voilà l’un des principaux enjeux des entreprises en matière de stratégie.
Et pour parvenir à détecter les informations le plus en amont possible comme la détection de projet avant la parution d’un appel d’offres, l’anticipation de la stratégie d’un concurrent, l’anticipation des risques, etc, la mise en place d’une veille stratégique est un des éléments indispensables.
Longtemps ignorée du grand public, la personnalisation constante des résultats par les plus importants moteurs de recherche, Google au premier chef, est maintenant très largement intégrée dans l’esprit de chacun, prenant même une place centrale dans le débat public concernant les problématiques de respect de la vie privée.
Google, comme d’autres géants du web, utilise chacune de nos recherches pour établir un profil qui permettra ensuite à l’entreprise de proposer des publicités personnalisées, mais aussi d’adapter les résultats de recherche afin qu’ils soient les plus « pertinents » possible.
Pourtant, au-delà de la question de la vie privée, certains activistes et professionnels de l’information se sont inquiétés de la création d’une « bulle » autour de l’internaute, les résultats de recherche s’adaptant au fur et à mesure pour ne proposer au final à l’internaute que ce qu’il veut lire, évacuant des résultats potentiellement intéressants mais que le moteur de recherche aurait jugé non-pertinents.
La veille sur un pays étranger, qu’elle soit d’ordre économique, concurrentielle ou sectorielle, représente souvent une véritable épreuve et ce, même quand on maîtrise correctement la langue du pays en question.
Quand on se trouve en terrain connu (en l’occurrence dans son propre pays), on sait généralement où chercher ou du moins, on connaît quelques sources de référence qui vont pouvoir ensuite nous aiguiller rapidement dans la bonne direction et vers les bonnes ressources. Dans un univers qui nous est complètement étranger ou presque, on sait ce que l’on cherche (au moins approximativement) mais on ne sait pas où chercher et surtout par où commencer.
On pourra bien évidemment commencer par explorer des sources internationales (serveurs et bases de données internationales, sites des grandes organisations internationales, ambassades, etc.) qui traitent du pays en question mais il serait dommage de se priver des sources d’informations locales qui sont généralement très complémentaires.
L’apparition et le développement de startups constituent une tendance forte aussi bien en France que dans le monde.
Il n’est d’ailleurs pas simple de définir précisément ce qu’est une startup. On peut en fait remarquer qu’il n’existe pas vraiment de définition standard de ce qu’est une startup, les définitions pouvant varier selon les sources.
Par exemple, pour Wikipedia, la startup est une jeune entreprise innovante à fort potentiel de croissance qui fait souvent l’objet de levées de fonds, alors que pour les créateurs de l’outil Sourcinno que nous verrons plus loin, une startup est une entreprise innovante avec potentiel de croissance et un modèle relativement déployable à l’international. On comprendra, au vu de ces définitions, qu’il n’est pas évident de faire, a fortiori de façon automatisée, une sélection parfaite de startups.