Sources d’informations pour la veille : du gratuit au payant il n’y a qu’un pas et vice-versa
Presse : le gratuit c’est fini ?
Avec le développement de la presse en ligne, principalement dans les années 2000, les éditeurs de presse généralistes en France, comme dans le reste du monde, ont souvent choisi la voie du presque tout-gratuit pour leurs contenus en ligne avec un modèle de financement par la publicité.
Même si tous les contenus presse et d’actualités n’étaient pas disponibles en libre accès, loin s’en faut, ce mouvement de masse a tout de même contribué à donner l’impression que l’information en provenance des médias était gratuitement accessible à tous.
Cependant, il y a une dizaine d’années déjà, on avait assisté à une première vague de retour à la presse électronique payante face au déclin des recettes publicitaires à l’image du Financial Times. D’autres comme Les Echos ou Le Monde, avaient opté pour des modèles hybrides combinant du gratuit et du payant.
Et depuis déjà deux ou trois ans, ce mouvement de retour au payant s’accélère, notamment aux Etats-Unis avec de nombreux éditeurs choisissant la solution du « paywall » (début des articles en libre accès uniquement) ou du modèle freemium (une partie des articles gratuits, les autres payants).
Un des derniers en date, l’éditeur américain Condé Nast a ainsi annoncé qu’il passerait la totalité de ses titres dont Vogue, GQ ou Bon Appétit sous paywall d’ici la fin de l’année 2019. En France, la tendance est également visible comme par exemple avec Mondadori qui a lui aussi récemment appliqué un paywall sur le site de Science et Vie.
Le rapport 2018 de l’institut Reuters publié en janvier 2019, où ont été interrogés plus de 130 médias issus de 29 pays, montre que la majorité des médias comptent aujourd’hui miser sur l’abonnement payant en ligne. 52 % des médias interrogés souhaitent en faire leur principale source de revenus en 2019 contre 27 % pour la publicité.
Sur le même sujet, nous vous invitons à lire ou relire notre billet de blog « Gratuité de l’information pour la veille : la fin d’une époque? » paru il y a un peu plus d’un an.
Depuis peu, on voit même se développer de nouveaux modèles de paywalls personnalisés appelés « paywalls dynamiques ».
Ils s’adaptent au profil de l’internaute, notamment pour éviter de faire fuir des lecteurs qui ont peu de chance de s’abonner un jour et leur proposer des alternatives adéquats.
Pour cela, ces paywalls s’appuient sur différents indicateurs : support utilisé (ordinateur, téléphone), moyen d’accès au site (depuis Google, depuis les réseaux sociaux, etc.), le temps passé sur le site de presse, etc. A partir des données récoltées, l’éditeur pourra proposer à certains internautes de s’abonner à la newsletter pour visualiser le contenu, à d’autres de visualiser une vidéo de publicité, ou encore de payer 1 euro pour accéder à l’article, etc.
Seul problème, cette personnalisation semble s’appuyer massivement sur la collecte des données, ce qui, en cette période de RGPD, n’est pas vraiment dans l’ère du temps.
Et ce n’est pas tout. Un récent article des Echos« Les médias français veulent s'assurer contre la possible fin des cookies » paru le 28 février dernier indiquait, qu’au-delà du RGPD, « l’Europe est également en train de finaliser la directive e-Privacy, qui inquiète les médias au plus haut point car le blocage des cookies pourrait se faire très simplement au niveau du navigateur Web. »
C’est pour cette raison qu’une vingtaine de médias français travaillent à un projet d’identification (log-in) commun à tous les sites de presse à partir de l’adresse mail des internautes.
Notre avis
Ce retour au payant de la presse signifie plusieurs éléments importants à prendre en compte pour la veille et la recherche d’information :
Tour d’abord, se limiter aux contenus presse gratuits pour une veille ou une recherche va devenir de plus en plus problématique.
On va alors passer à côté de plus en plus d’information pertinente. D’autant plus que Google Actualités, le moteur d’actualités gratuit le plus utilisé, n’est plus ce qu’il était et qu’il menace de fermer ses portes ou de « caviarder » ses résultats si la directive européenne sur le droit d’auteur est appliquée en l’état (voir notre article « Brèves de veille » à la fin de ce numéro).
D’autre part, avec le développement des paywalls sur les sites de presse, il arrive de plus en plus fréquemment, que, même en utilisant un outil de recherche (agrégateurs de presse ou base de données) ou de veille payant, on n’arrive pas à accéder directement au texte intégral de l’article. Il va donc falloir de plus en plus acheter des articles à l’unité quand cela est possible ou souscrire à une multitude d’abonnements isolés.
Et alors que la recherche d’information est de plus en plus unifiée et accessible depuis une seule interface, l’accès au texte intégral des articles de presse ne semble pas prendre le même chemin...
Aparté juridique : quand source gratuite ne signifie pas veille gratuite
On rappellera qu’effectuer une veille sur des médias gratuits ou la partie gratuite des sites de presse implique néanmoins certains devoirs et le paiement de certains droits.
S’il est parfaitement légal de consulter les articles de presse accessibles gratuitement en ligne, rediffuser des articles de presse sans payer de droits est par contre totalement illégal.
De même, en France, mettre sous surveillance certains sites de presse sans payer de droits est désormais officiellement illégal.
En France, c’est le CFC qui gère collectivement pour le compte des auteurs et des éditeurs les droits de copie papier et numériques du livre et de la presse.
Dans le cas des panoramas de presse et la rediffusion d’articles de presse, le CFC propose des contrats de veille médias pour gérer la question des droits. Lorsque l’on passe par un agrégateur de presse commePress’Edd, Factiva ou encoreLexisNexis, la gestion des droits est prise en charge par le prestataire et dépend du contrat souscrit.
En revanche, jusqu’à récemment, la veille Web bénéficiait d’un flou juridique. Seuls certains éditeurs de presse interdisaient le crawl de leurs sites aux principales plateformes de veille.
Mais depuis peu, le CFC est mandaté par les éditeurs de presse pour encadrer la veille Web sur les sites de presse et d’actualités (plus de 3 500 sites auraient déjà délégué la gestion de leurs droits d’auteur au CFC).
La liste des sites ayant signé avec le CFC est disponible à cette adresse :
A ce jour, seuls les outils de veille Cedrom-SNI, Coexel, Data Observer, KB Crawl, Qwam Content Intelligence et Sindup ont signé un accord avec le CFC.
On signalera enfin que les articles 11 et 13 de la directive européenne sur les droits d’auteur ont été finalisés il y a quelques jours.
Et mauvaise nouvelle pour les professionnels, l’article 11 stipule que tous les moteurs, agrégateurs mais aussi sites lucratifs ou non lucratifs qui utilisent plus que de « très courts extraits » d’articles de presse devront négocier en amont avec les éditeurs... Reste à savoir ce qui se cache derrière le terme de « très courts extraits » car aucune définition précise n’a pour l’instant été donnée.
La littérature scientifique et le développement de l’open access et de l’open science
Du côté de la littérature scientifique et académique traditionnellement payante et gérée par des gros éditeurs comme Elsevier, Springer, etc., on assiste au mouvement inverse avec le développement de l’open access.
Si on est encore loin du tout open access, et même si certains le prédisent pour 2040, il n’en reste pas moins que la part d’open access dans la production scientifique ne cesse d’augmenter.
Une récente étude (https://peerj.com/articles/4375/) publiée en février 2018 estimait que plus de 28% de la littérature scientifique et académique était aujourd’hui en open access et que pour l’ensemble des articles publiés en 2015, elle s’élevait même à 47%.
On précisera tout de même que la part d’open access varie beaucoup d’une discipline à l’autre. La part d’open access est ainsi très importante pour le biomédical ou encore les mathématiques (plus de 50% des articles publiés entre 2009 et 2015) et reste faible pour la chimie ou les sciences de l’ingénieur (moins de 20% des articles publiés entre 2009 et 2015).
De plus, comme il n’est pas toujours simple de vérifier si un article est disponible en version gratuite quelque part sur le Web (de manière légale), on voit se développer de nombreux plugins aussi appelés « access brokers » qui se chargent d’indiquer si un article est disponible en libre accès quelque part à l’image d’Unpaywall ou Kopernio. D’autres (pas nécessairement gratuits) vont même encore plus loin en identifiant si l’article est disponible gratuitement sur le Web et si le document est déjà disponible au sein de la bibliothèque ou de l’organisation ou même si celle-ci dispose déjà d’un abonnement. On citera des outils comme Lean Library ou encore Anywhere Access.
Enfin, ce mouvement de l’open science permet également d’accéder gratuitement à de nouveaux contenus liés à la production scientifique comme les datasets (données produites dans le cadre de la recherche scientifique) qui n’étaient que très peu partagés par le passé (que ce soit de manière gratuite ou payante) et donc inaccessibles. Sur ce sujet, nous vous invitons à lire notre récent numéro de BASES sur le sujet (BASES n°364 - Novembre 2018).
Notre avis
La veille et la recherche d’information scientifique et académique est aujourd’hui multiple.
Il faut à la fois prendre en compte les sources classiques payantes qui ont toujours une forte valeur ajoutée de par la nature de leur contenu et la puissance de leurs fonctionnalités de recherche. Mais si les contenus en open access commencent à faire leur chemin dans ces outils, on est encore loin de l’exhaustivité.
Il faut donc également prendre en compte et intégrer dans son dispositif de veille tous ces nouveaux outils, liés au mouvement de l’open access et de l’open science.
Le développement de l’open data pour les données publiques et de certaines entreprises
Le développement de l’open data, qu’il s’agisse des données produites par les collectivités publiques voire même de plus en plus par des entreprises, offre de nouveaux contenus gratuits qu’il est intéressant d’intégrer à son processus de veille.
Par le passé, ces contenus étaient bien souvent inaccessibles (produits par les collectivités mais pas mis à disposition ni de manière payante ni gratuite). Dans certains cas, les données qui étaient auparavant payantes sont devenues gratuites à l’image par exemple de la base de données SIRENE recensant des informations sur les entreprises françaises, et qui est devenue gratuite en 2017.
Sur ce sujet, nous vous invitons à lire notre récent numéro de BASES sur le sujet (BASES n°364 - Novembre 2018).
Notre avis
Quel que soit le sujet de sa veille, on a intérêt à se demander si une partie des données que l’on recherche est susceptible de se retrouver en open data.
Et si c’est bien le cas, il faut alors aller identifier les sources qui pourraient les mettre à disposition (sources spécialisées open data ou site des producteurs des données).
La surveillance des réseaux sociaux à la merci des géants du Web
Du côté des réseaux sociaux, les temps ont également changé... Il est de plus en plus difficile aujourd’hui d’effectuer une veille de qualité sur ces sources car les grands acteurs comme Facebook, LinkedIn, Instagram restreignent de plus en plus leurs accès à des applications et outils extérieurs ou facturent l’accès et la surveillance à des coûts exorbitants.
Aucun outil de veille n’est aujourd’hui en mesure de surveiller correctement LinkedIn. Instagram a récemment fermé son API et oblige les éditeurs à négocier en direct avec lui, À la suite du scandale Cambridge Analytica, Facebook a abandonné PYLON, son service fourni en partenariat avec Datasift qui fournissait les données et informations publiques et privées des utilisateurs mais anonymisées.
Enfin, Twitter limite ses partenariats avec des outils extérieurs et les facture au prix fort.
Notre avis
Dans ce contexte, on se retrouve vite obliger de passer par les fonctionnalités de veille offertes par ces mêmes réseaux sociaux qui sont souvent assez sommaires (à l’exception notable de Twitter) ou de relancer régulièrement des recherches ponctuelles...
Et à choisir entre plusieurs outils payants, on aura intérêt à choisir plutôt un outil qui a négocié un partenariat direct avec un ou plusieurs réseaux sociaux afin d’avoir réellement accès aux données.
Autres types de contenus : des évolutions mineures.
Du côté des études de marché, des informations sur les entreprises ou encore des appels d’offres, on notera quelques évolutions mais bien moins importantes que sur les autres types de contenus utiles à la veille.
Les éditeurs d’études de marché proposent de plus en plus l’achat d’études en Pay as you go ou l’achat de chapitres uniquement, même si ce n’est pas nouveau (Profound en son temps avait innové en proposant l’achat d’études à l’unité).
L’information financière et sur les entreprises est plus facilement accessible gratuitement notamment grâce au développement de l’open data (comme la base SIRENE par exemple). Cependant, il s’agit bien souvent de données basiques et seules les bases de données financières payantes permettent d’élaborer une vraie vision financière des sociétés.
Enfin, si les appels d’offres sont généralement accessibles gratuitement, il n’en reste pas moins que le nombre de sources à surveiller étant titanesque et les possibilités de recherche et de veille très sommaires, il est souvent préférable de passer par un outil ou prestataire spécialisé et donc payant qui va proposer un corpus unifié et des fonctionnalités de recherche avancées.
Les outils payants de la veille ou la tentation de l’outil unique
Face à ces évolutions des sources d’information, les outils professionnels liés à la veille et la recherche d’information ont également revu leur copie.
Les outils professionnels traditionnellement utilisés pour la recherche d’information ont progressivement intégré des fonctionnalités de veille et diversifient leurs contenus.
Les outils de veille traditionnels tendent à devenir multisources mêlant aussi bien du gratuit que du payant.
Les agrégateurs de presse comme LexisNexis ou Europresse se positionnent aujourd’hui comme des outils de recherche et de veille « 360° » (presse bien sûr mais aussi médias sociaux, Web, vidéos, etc.).
Les outils de recherche scientifiques et académiques comme Scopus ou Web of Science par exemple intègrent des fonctionnalités de veille et de plus en plus d’articles en open access. L’éditeur Elsevier, qui propose l’outil Scopus ne cesse d’ailleurs de racheter des outils et entreprises liées à l’open access et l’open science.
Et du côté des outils de veille traditionnels (outils de surveillance de pages et de sites) comme KB Crawl, Digimind Intelligence, Iscope, etc., on note une intégration progressive des médias sociaux (même si ce n’est pas simple en raison des limitations), des ressources internes de l’entreprise (connecteurs avec le RSE de l’entreprise par exemple ou développement d’un RSE lié à la plateforme comme chez KB Crawl par exemple). Depuis quelques mois, on note d’ailleurs une communication accrue autour de l’intégration de sources d’information payantes.
Cette intégration du payant dans les plateformes de veille, est-elle complètement nouvelle ? Quelle est aujourd’hui la place des sources d’information payantes chez les outils de veille ? C’est ce que nous avons exploré dans le prochain article de ce numéro.