Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Recherche et veille sur les articles de presse : entre tradition et renouveau

Netsources no
150
publié en
2021.02
1907
Recherche et veille sur les articles de presse : entre ... Image 1
Recherche et veille sur les articles de presse : entre ... Image 1

La recherche et la veille sur les articles de presse est ce qu’il y a de plus classique et de mieux connu. Pourtant, si l’article de presse en tant que tel évolue peu, bien qu’il puisse être enrichi avec des contenus graphiques et multimédia, les outils de recherche, eux, évoluent et se renouvellent régulièrement. Et c’est à eux qui nous allons ici nous intéresser.

Quelles sont les outils et méthodes aujourd’hui disponibles pour rechercher et faire de la veille sur la presse ?

Dans cet article, nous nous intéresserons aux produits d’information «classiques» de la presse c’est-à-dire les articles de presse. Les « nouveaux » formats de la presse seront quant à eux abordés dans l’article de ce même numéro « Les nouveaux formats des médias appellent de nouvelles méthodes et outils de recherche et veille ».

Lire la suite :

Comment surveiller Google Actualités ?


Les moteurs d’actualités : est-ce une solution ?

Nous avons fait le choix de commencer par les outils de recherche gratuits sur la presse pour finir avec les outils de recherche les plus performants que sont les agrégateurs de presse professionnels.

Nous commencerons donc ici par les moteurs de recherche d’actualités qui ont l’avantage d’indexer les contenus de très nombreux journaux à travers le monde, et permettent de rechercher sur le texte intégral des articles, même s’ils n’y donnent pas complètement accès lorsque l’article est payant.

Les moteurs d’actualités ne sont plus légion. Pour la veille et la recherche d’information, il y a surtout Google Actualités et dans une moindre mesure Bing Actualités.

On pourrait également penser aux moteurs d’actualités des autres moteurs comme Qwant Actualités, Yandex News, etc. Le corpus est en général plus limité et les fonctionnalités proposées moins avancées.

Mais d'autres outils existent.

On citera notamment Meta-press, une extension de navigateur pour rechercher sur la presse (288 sources sont actuellement référencées dont 106 pour la France). Le moteur opère un classement des résultats parfois étonnant. Une recherche simple sur « Dunkerque » qui fait actuellement l’actualité pour son confinement le week-end, fait ressortir dans les premiers résultats principalement le film Dunkerque … Les filtres ne fonctionnent pas toujours bien et il fait aussi ressortir des résultats datant du futur (plusieurs articles de Numerama datant de décembre 2021 dans notre cas).

Au final, l’outil est un complément qui peut faire ressortir des médias non référencés dans Google Actualités et Bing Actualités mais il faut quand même le manier avec précaution.

Comment rechercher sur Google Actualités ?

On accède à Google Actualités de deux manières :

  1. la première, en interrogeant l’interface classique de Google puis en cliquant sur « Actualités » dans le bandeau situé sous la zone de saisie des mots clés ;
  2. la seconde en se rendant directement sur l’interface de Google Actualités.

Dans un contexte de veille et de recherche d’information, on privilégiera la première qui fournit généralement plus de résultats.

De plus, l’interface de Google Actualités a beaucoup de défauts, comparée à l’interface classique de Google : lenteur, limitation du nombre de résultats à 100, antériorité limitée, disparition de certains filtres, titres des articles seulement. Le seul intérêt de l’interface de Google Actualités étant sa capacité à agréger automatiquement des articles d’actualités sur un même sujet.
En termes de stratégie de recherche, on conseillera de rechercher sur Google Actualités comme sur Google, c’est à dire en privilégiant les requêtes courtes en langage naturel et en ciblant à chaque fois un besoin d’information bien précis. On évitera donc les longues requêtes booléennes combinant des OR.

On pourra également s’aider des opérateurs avancés comme l’opérateur site: pour rechercher sur des sites de presse bien spécifiques ou inurl: pour rechercher les termes contenus dans l’URL.

Comment faire de la veille sur Google Actualités ?

Surveiller Google Actualités n’est pas si simple, d’autant que Google a supprimé les flux RSS de son interface il y a quelques années. Il existe aujourd’hui plusieurs solutions mais qui ne donnent pas nécessairement les mêmes résultats.

Dans un récent article de BASES, « Comment surveiller Google Actualités ? » (BASES n°381 - mai 2020), nous avions testé ces différentes possibilités pour évaluer lesquelles étaient les plus appropriées.

Aujourd’hui, pour surveiller Google Actualités, on peut :

  • utiliser Google Alertes en indiquant que l’on souhaite surveiller uniquement l’index Actualités. Mais de toutes les solutions, nos tests ont montré que c’est Google Alertes qui ramène le moins de résultats ;
  • utiliser les fonctionnalités intégrées des lecteurs RSS comme Inoreader et Feedly mais attention ici, car Inoreader par exemple surveille l’index anglophone de Google Actualités et non le francophone alors que Feedly laisse le choix entre 11 langues différentes ;
  • utiliser les fonctionnalités intégrées des plateformes de veille et de social media monitoring ;
  • créer son propre flux RSS en utilisant la méthode suivante https://news.google.com/news/rss/search/section/q/{query} ;

Pour aller plus loin dans la création de flux RSS sur Google Actualités, on conseillera la lecture d’un récent article intitulé « Google News RSS. The missing documentation” https://blog.newscatcherapi.com/google-news-rss/.

Comment rechercher et faire de la veille sur Bing Actualités

Sur Bing, il n’existe pas de différence entre le fait de rechercher sur le moteur web et le moteur d’actualités. En fait, quand on recherche sur le moteur web et que l’on clique dans un second temps sur l’onglet Actualités, Bing nous ramène automatiquement sur l’interface de Bing Actualités.

En ce qui concerne la recherche, on constate, comme sur Google, qu’il vaut mieux éviter les longues requêtes combinant des OR, qui ont tendance à générer moins de résultats et privilégier des requêtes plus courtes.

On voit aussi que même si on recherche en anglais, Bing Actualités sélectionne tout de même des résultats liés au pays et à la langue choisie dans ses paramètres par défaut (pour nous en l’occurrence le français). Il faudra donc changer ces paramètres à chaque fois que l’on souhaite rechercher dans une autre langue.

Et pour la veille, Bing Actualités a fait disparaître la possibilité de s’abonner directement par flux RSS. Néanmoins, on peut toujours rajouter une extension dans l’URL pour générer un flux RSS. Il faudra le construire de la manière suivante :

https://www.bing.com/news/search?q=Mot1&format=rss

On observe cependant que même si le flux semble dans sa langue de prédilection quand on se trouve dans le moteur, quand on l’intègre à son lecteur de flux RSS (nous avons fait le test sur Feedly), il choisit la langue de l’interface en .com et donc l’anglais.

Les limites des moteurs d’actualités

Si Google Actualités et Bing Actualités sont des incontournables pour la recherche d’information presse, ils ont leurs limites et leurs défauts.

Tout d’abord, la couverture de la presse y est très parcellaire. Ce sont avant tout les grands titres de presse nationaux et économiques qui y apparaissent. Même si elle n’est pas absente, la presse locale ou encore spécialisée est loin d’être couverte de manière complètement satisfaisante, et ce, malgré des discours très pro-presse locale de la part de ces deux acteurs.

Une étude récente menée par des chercheurs de l’université de Pennsylvanie et de l’université nationale de Singapour s’est d’ailleurs intéressée à la visibilité de la presse locale dans Google Actualités et les résultats viennent contredire les discours pro-presse locale de Google.

L’étude a fait l’objet d’une publication dans la revue Nature Human Behaviour en septembre 2020 (https://www.nature.com/articles/s41562-020-00954-0).

Les auteurs ont ainsi mené 96 000 recherches aux Etats-Unis sur des thèmes nationaux mais aussi locaux. Ils ont utilisé les paramètres de leur navigateur pour changer leur localisation dans chaque comté des États-Unis. Ils ont également utilisé le mot-clé «near» pour rechercher et collecter les résultats de Google News sur de nombreux sujets différents. Ils ont pu mettre en évidence que les recherches nationales faisaient ressortir majoritairement des médias nationaux et les recherches locales des médias locaux. Jusque-là rien d’anormal. Néanmoins, ils ont pu constater que même sur des recherches locales, la première page de résultats était quasiment toujours constituée principalement de médias nationaux. Les médias locaux n’arrivent que dans les pages suivantes, ce qui leur confère peu de visibilité car la majorité des internautes ne dépasse pas la première page.

Nous avons fait quelques tests rapides sur la version française de Google Actualités pour voir s’il en était de même en France.

Nous avons lancé 3 requêtes distinctes :

  1. Une sur le maire de Berck sur mer, Bruno Cousein qui n’a pas une très grande visibilité au niveau national;

    Pour la première requête, pas de surprise, tous les résultats proviennent de la presse locale en l’occurrence surtout le Réveil de Berck et La Voix du Nord. Cependant, d’autres titres locaux qui pourtant citent parfois le maire comme Nord Littoral ou le Courrier Picard n’apparaissent absolument pas dans Google Actualités.

  2. Une autre sur le maire du Touquet, Daniel Fasquelle qui a récemment fait l’objet d’articles dans la presse nationale suite à un cambriolage dans sa résidence parisienne;

    Pour la seconde, 6 résultats sur les dix premiers ne sont pas issus de la presse locale qui couvre la région du Touquet. Et là encore, il manque des titres de presse importants de la région.

  3. Une dernière sur le confinement à Dunkerque (confinement dunkerque) qui a toutes les chances d’être traité à la fois dans la presse nationale et locale.
    Pour la troisième, ce sont 5 résultats sur les dix premiers qui sont issus de la presse nationale et non locale.

Il est impossible de déterminer si la presse locale est réellement discriminée mais cela montre surtout que toute la presse locale française est loin d’être référencée dans Google Actualités et qu’on a grand intérêt à classer les résultats de recherche par date pour faire disparaître les éventuels biais de l’algorithme du moteur.

Et à l’heure où Google signe des accords avec certains (grands) éditeurs de presse pour faire apparaître leurs articles dans son nouveau produit Google News Showcase, certains craignent que les éditeurs qui ne font pas partie de ce nouveau programme soient encore moins visibles sur Google Actualités. En l’occurrence les petits éditeurs et la presse locale et spécialisée…

Les Netflix de la presse et autres outils : une fausse bonne idée

Depuis quelques années, on voyait se développer en France des « Netflix » de la presse permettant aux internautes d’accéder avec un abonnement mensuel à des centaines voire des milliers de titres de presse en texte intégral. Parmi les plus connus, il y avait Lekiosque.fr (rebaptisé ensuite Cafeyn), E-Presse ou encore SFR Presse ainsi que des acteurs plus modestes comme Pressmium.

Voir BASES n°375 - novembre 2019

L’heure semble aujourd’hui à la structuration du marché avec l’émergence d’un leader européen incarné par Cafeyn. En 2020, Cafeyn a ainsi racheté SFR Presse puis quelques mois plus tard le néerlandais Blendle qui a une forte présence au Bénélux, Pays-Bas, Allemagne et Etats-Unis. Grâce à ses différents rachats, Cafeyn est aujourd’hui en mesure de proposer plus de 2500 titres de presse.

De quoi distancer largement les quelques acteurs restants : E-presse compte aujourd’hui tout de même 1200 titres mais Pressmium semble quant à lui avoir beaucoup de mal à élargir son catalogue au-delà de quelques dizaines de titres.

Si on peut avoir le sentiment que ces outils peuvent être utilisés comme des «agrégateurs de presse pro» mais à moindre coût, il n’en est rien. Leurs fonctionnalités de recherche et de veille sont quasi-inexistantes. On pourra au mieux retrouver un article dont on connaît déjà le nom.

Ces plateformes ne permettent généralement pas ou très difficilement de télécharger les articles et sont conçues dans une optique de « feuilletage » de magazines et journaux. De plus, la gestion éventuelle des droits d'auteur pour la rediffusion n'est pas prise en compte car ces outils n'ont pas été prévus pour cet usage.

Les réseaux sociaux : une porte d’accès aux articles presse

Rechercher la presse sur les médias sociaux

Interroger les médias sociaux peut être une option intéressante pour interroger la presse et repérer des articles pertinents. Et le meilleur allié en la matière n’est autre que Twitter !

En effet, sur Twitter, les fonctionnalités de recherche et la traçabilité des résultats sont au rendez-vous. Et nombreux sont les médias qui mettent en avant leurs articles et les internautes qui partagent des articles de presse qu’ils jugent pertinents. Certains titres de presse peu visibles sur les moteurs généralistes peuvent ici gagner en visibilité et être repérés plus facilement.

Sur Twitter, on conseillera l’utilisation de requêtes booléennes traditionnelles qui fonctionnent ici très bien.

En revanche, on aura intérêt à choisir l’onglet « Récent » dans les résultats pour bien avoir accès à tous les résultats répondants à une requête et non une sélection effectuée par l’algorithme.

On notera aussi que Facebook a lancé récemment dans différent pays (prochainement en France) son service Facebook News qui se matérialise par un onglet dédié aux actualités et articles de presse. A l’image de Google, Facebook rémunère les titres de presse qui y apparaissent.

Même s’il est encore impossible d’évaluer pleinement le potentiel de ce service, il est fort probable qu’il soit peu utile aux professionnels de l’information. Car Facebook n’est pas réputé pour la pertinence de sa recherche et de ses fonctionnalités. La recherche sur Facebook génère en général une sélection de résultats sans garanties d’avoir accès à tous les articles indexés par Facebook.

Facebook News sera probablement plus utile pour se voir recommander des articles en lien avec ses centres d’intérêts plutôt que pour effectuer de véritables recherches.

Faire une veille presse à travers les médias sociaux

Là encore, c’est Twitter qui sera le plus utile et le plus fiable.

Pour créer des alertes sur Twitter, on a surtout le choix entre l’utilisation d’une plateforme de veille ou à défaut, d’un lecteur de flux RSS qui propose une option de création de flux pour Twitter, comme c’est le cas dans Inoreader, Feedly et quelques autres outils freemium.

Queryfeed en revanche, qui permettait de créer des flux RSS sur Twitter notamment, a récemment fermé ses portes.

Twitter ayant supprimé la possibilité de créer des flux RSS il y a quelques années.

Voir aussi  « Comment rendre Twitter plus puissant pour la veille et la recherche ? » (Bases n°383 - juillet/août 2020).

Les valeurs sûres : les agrégateurs de presse et les plateformes de veille

Parallèlement à ces solutions gratuites ou peu onéreuses, les agrégateurs de presse professionnels restent une solution très performante pour rechercher et faire de la veille sur la presse.

Ces acteurs qui existent depuis des décennies proposent des outils de recherche sophistiqués avec des corpus de titres de presse de qualité. Avec les années, ces outils ont quand même adapté leur positionnement et leur stratégie et se définissent majoritairement comme des plateformes de veille média qui intègrent désormais des fonctionnalités de veille mais ont aussi élargi leurs sources à des contenus multimédia et des sources pas nécessairement presse (blogs, réseaux sociaux, podcasts, etc.).

En France, le marché des agrégateurs de presse est dominé par 4 grands acteurs :

  • Tagaday (ex-Pressedd) qui inclut désormais la presse, radio, TV et des contenus web avec un très fort ancrage sur les contenus français. C’est d’ailleurs cet outil qui dispose actuellement de la meilleure couverture de la presse française notamment locale et spécialisée.
  • Europresse (Cision) qui mise sur des contenus à 360° comme la presse, web, études, rapports, biographies, médias sociaux et qui est notamment très utilisé dans les établissements d’enseignement ;
  • Factiva (Dow Jones) avec sa dimension internationale qui garde un ancrage très presse traditionnelle avec l’incursion de quelques contenus hors presse (blog) et une meilleure couverture des marchés émergents.
  • Lexis Nexis Newsdesk qui a également cette couverture internationale mais une plus grande diversité de contenus et notamment des nouveaux formats (presse, radio, TV, podcasts, blogs, réseaux sociaux, etc.)

On citera également Naviga Newsedge (récemment racheté par Moody’s), qui reste cependant peu utilisé en France.
N’oublions pas les agrégateurs de presse nationaux utiles quand on s’intéresse à certains pays comme Swissdox pour la Suisse, GBI Genios pour l’Allemagne, GoPress pour la Belgique, etc. On aura d’ailleurs intérêt à essayer de les identifier quand on mène fréquemment des recherches sur certains pays.

On citera enfin quelques outils avec un positionnement spécifique qui peuvent être utilisés en complément mais qui n’ont pas une couverture aussi complète:

  • Delphes, une base de données de presse économique et sectorielle ;
    Voir BASES n°387 - décembre 2020
  • Pickanews, un moteur de veille et recherche pluri média (presse, TV, Radio, Internet, Twitter) appartenant au groupe Kantar et qui fonctionne sur un modèle d’achat de crédits d’articles ;
  • Les serveurs professionnels Ebsco et Proquest qui ont des bases de données presse ;
  • La base de données EMIS spécialisée sur les pays émergents qui inclut de la presse et des sites d’actualités.

On notera parallèlement que depuis quelques années, les plateformes de veille traditionnelles et de social media monitoring ont élargi leurs contenus pour intégrer de la presse payante.

Certains ont des partenariats directs avec des acteurs pour intégrer ces contenus. C’est par exemple le cas de Digimind, Sindup, Talkwalker ou encore Meltwater. Les autres ont pratiquement tous signé des contrats avec le CFC pour la surveillance de sites médias et offrent des connecteurs pour intégrer ses abonnements (presse, bases de données ou agrégateurs) à la plateforme de veille.

Ces outils ont bien évidemment une grande valeur ajoutée d’une part grâce à leur corpus qualifié et sélectif et d’autre part grâce à la puissance de leurs fonctionnalités de recherche, mais il ne faut pas oublier non plus qu’ils ne sont pas exhaustifs.

Presse écrite et web : revenons au sourcing

Les grands titres de presse nationaux et économiques d’un pays sont généralement bien couverts par les moteurs d’actualités et les bases de données professionnelles mais on ne peut pas toujours en dire autant de la presse locale ou spécialisée. La couverture peut énormément varier selon l’outil utilisé, le secteur d’activité concerné, la zone géographique sur laquelle on recherche, etc.

Toujours est-il que même les agrégateurs de presse payants ne sont pas exhaustifs et il y a toujours un risque qu’un titre de presse-clé pour sa recherche d’information n’y soit pas présent. C’est pour cette raison qu’il est fortement conseillé de réaliser un sourcing parallèlement à l’utilisation des outils cités précédemment pour d’une part, vérifier que les titres-clés pour sa recherche et sa veille s’y trouvent bien et, le cas échéant mettre en place une démarche spécifique pour ces titres-là.

Voir aussi : NETSOURCES n°146 (mai-juin 2020) consacré au sourcing

Dans le cas de la presse locale et spécialisée (qui a le plus de risques d’être absente des grands outils de recherche presse), on conseillera la démarche suivante :

  • faire une recherche Google par exemple presse + nom d’une ville, d’un département ou d’une région ;
  • explorer les associations du secteur en question ;
  • explorer les sponsors presse des grands événements professionnels du secteur ;
  • essayer de repérer des comptes spécialisés sur les réseaux sociaux (en lançant une recherche sur les profils ou en explorant les abonnements de certains internautes spécialisés) ;

Quand on effectue des recherches locales, on a donc intérêt à identifier précisément quels sont les titres de presse locale disponibles.

Spécifiquement pour la presse locale française, on pourra également :

  • explorer les sites des syndicats de presse comme l’UPREG (Union de la Presse en Région) pour la presse locale française par exemple ou l’ACPM - Le syndicat de la presse hebdomadaire régionale n’a malheureusement plus de site web) ;
  • regarder l’infographie du Monde Diplomatique, intitulé « Médias Français : qui possède quoi » qui cherche à mettre en évidence les liens entre les médias et des groupes industriels, financiers, des groupes de presse ou encore l’état. Au niveau local, on pourra identifier quelques titres de PQR. Les titres départementaux ou la presse alternative n’y sont pas présents (https://github.com/mdiplo/Medias_francais)  ;
  • regarder L’infographie « Le paysage médiatique Français : un essai de représentation » (https://lesmediaslemondeetmoi.com/le-paysage-mediatique-francais-un-essai-de-representation/) où l’on trouve également quelques titres de presse locaux.

Et pour identifier les titres de presse locale les moins visibles, il existe également une excellente carte appelée « La carte de la Presse pas pareille » qui recense, selon leur description « les journaux non inféodés aux pouvoirs politiques et économiques » (https://lagedefaire-lejournal.fr/carte-de-la-presse-pas-pareille/). Plus d’une centaine de médias y sont référencés. Et nous avons fait le test sur plusieurs titres : aucun ne se retrouve dans les outils de recherche traditionnels.

On pourra ensuite :

  • rechercher sur ces sites ou via Google avec l’opérateur site:;
  • utiliser un moteur CSE (moteur personnalisé de Google) ;
  • intégrer ces sources à un lecteur RSS et rechercher dessus ;
  • mettre ces sources en veille via un outil de veille ou lecteur RSS.

Dans certains cas, il faudra encore s’abonner à des revues papier / PDF et donc les dépouiller manuellement ou se créer son propre petit outil de recherche.

Le cas des blogs hébergés sur les sites de médias d’information

En plus des traditionnels articles de presse, bon nombre de médias d’information avaient mis en place des systèmes de blogs sur leurs sites lors de l’avènement du web 2.0 dans les années 2010. Ces blogs permettaient à n’importe quel internaute de créer un blog hébergé sur le site du journal, ce qui pouvait porter à confusion alors que le journal ne cautionnait en rien ce qui y était écrit.

Ces plateformes de blogs de lecteurs ont pour la très grande majorité toutes disparu.

Mais on trouve encore régulièrement des blogs sur les sites des journaux et magazines où les billets sont rédigés par les journalistes eux-mêmes ou des experts triés sur le volet.

En règle générale, on constate que ces billets de blogs sont indexés dans les outils de recherche classiques comme les moteurs d’actualités et les agrégateurs de presse ou les plateformes de veille.

Pour la veille, on pourra adopter ici une démarche classique avec flux RSS s’il existe, création de flux RSS ou ajout à un outil de surveillance de pages.

Le cas particulier de la presse ancienne

Dans certains cas, il peut être utile de rechercher sur la presse ancienne (20e siècle ou même antérieur). Or ces contenus sont souvent difficiles à identifier et difficilement accessibles.

Même si les agrégateurs de presse professionnels ont une antériorité importante, rares sont ceux qui remontent aussi loin, voire beaucoup plus loin comme Le Monde jusqu'à 1944, date de création du quotidien.

De plus, à cette époque, les articles n’étaient disponibles qu’au format papier et il n’y a pas nécessairement eu de politique de numérisation des articles. Et parfois même, le journal a disparu et il ne subsiste aucune archive. Dans ce cas précis, on ne pourra malheureusement rien faire.

Mais dans un certain nombre de cas, on peut tout de même remonter la trace de certains journaux et réussir à obtenir l’article que l’on souhaite.

On pourra :

  • contacter l’éditeur s’il existe encore et lui demander la copie de l’article, ce qui peut généralement fonctionner ;
  • utiliser les bibliothèques numériques nationales qui contiennent généralement une partie de presse numérisée (comme Gallica en France par exemple) ;
  • consulter les produits dédiés à la numérisation de la presse comme Retronews (http://presselocaleancienne.bnf.fr/html/journaux-numerises), etc ;
  • essayer d’identifier des bibliothèques numériques locales qui pourraient avoir de la presse numérisée ;
  • rechercher sur Google Books qui contient de vieux titres de presse ;
  • interroger des catalogues de bibliothèques pour identifier une bibliothèque susceptible de détenir un exemplaire du journal ;
  • regarder sur Amazon qui réédite parfois de vieux livres, magazines ou journaux.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...