Presse française en ligne : substitut ou complément de la presse papier ?

A l’heure où le quotidien La Tribune annonce la disparition de sa version papier au profit de son édition numérique, nous avons choisi de nous pencher sur l’univers nébuleux de la presse en ligne et des sites d’actualités, afin d’y voir plus clair sur les contenus proposés (s’agit-il de contenu propre, du même contenu qu’une édition papier…) et les moyens mis à disposition pour y accéder.

Dans le cadre de cet article, nous nous limiterons à la presse française, mais certains constats et remarques faits ici peuvent tout aussi bien s’appliquer à la presse internationale.

Il n’est pas rare pour un professionnel de l’information de croiser des collègues qui ont le sentiment de pouvoir effectuer toutes les recherches presse par eux-mêmes en n’interrogeant que le Web gratuit, un client qui souhaite limiter sa recherche à la presse web car il a déjà interrogé la presse papier – ou l’inverse –, ou encore un prestataire de veille qui intègre (soi-disant) la presse française mais qui, en réalité, ne surveille que la partie gratuite des sites de presse ou des sites d’actualités. 

Même si le contenu journalistique disponible gratuitement sur des sites de presse s’est considérablement développé au cours des dernières années, ne risque-t-on pas de passer à côté d’informations pertinentes ? Les sites web des titres de presse ont-ils une valeur ajoutée par rapport aux éditions papier ?

PRESSE EN LIGNE ET SITES D’ACTUALITES : AU BON VOULOIR DE CHAQUE EDITEUR...

Quand on cherche à savoir si le contenu d’un site de presse est l’équivalent de l’édition papier, il n’existe bien souvent qu’une seule solution : vérifier manuellement que certains articles de l’édition papier se retrouvent sur le site web et vice et versa. Il est en effet assez rare que les titres de presse affichent clairement leur politique en la matière.

Pour les titres de presse existant en version papier, on distingue plusieurs scénarios possibles :

• le site internet propose strictement le même contenu que l’édition papier ; c’est le cas des DNA – Dernières Nouvelles d’Alsace par exemple, mais seule une partie des articles est accessible gratuitement ;

• le site internet ne propose que quelques actualités ou bien une petite sélection d’articles issus de l’édition papier ; il s’agit plus d’un site vitrine que d’un véritable site d’informations – c’est souvent le cas de la presse hebdomadaire régionale ; 

• le site internet propose un contenu intéressant, mais différent de l’édition papier, même s’il peut y avoir quelques recoupements ; c’est le cas par exemple de Ville, Rail et Transport ;

• le site internet offre à la fois le contenu de l’édition papier, mais également des compléments ; c’est le cas en particulier du site des Echos, où l’on retrouve les articles de la version papier et des articles parus uniquement dans la version web. Certains de ces articles sont accessibles gratuitement, tandis que d’autres sont réservés aux abonnés.

De l’autre côté, on trouve également de très nombreux titres de presse ou sites d’actualités qui n’existent qu’en version numérique (Mediapart, Backchich ou Avinews.com – site d’actua-lités d’Avignon – par exemple).

En ce qui concerne les modalités d’accès aux articles du site, on constate que chaque éditeur fait ce que bon lui semble. 

Dans certains cas, tout le contenu du site est en accès libre ; dans d’autres cas, la quasi-totalité des articles sont en accès payant, à l’exception de quelques brèves. Il existe également de nombreux sites qui proposent les articles récents en accès payant et le reste en libre accès (c’est le cas du site de LSA notamment) ou bien l’inverse (les articles récents sont gratuits mais pas les archives). Impossible donc de dégager la moindre tendance. A ce stade, on peut en conclure qu’effectuer une recherche dans la presse en ligne française n’est en aucun cas équivalent à une recherche dans toute la presse française. 

Il est impossible de savoir a priori si le contenu en ligne est identique à la version papier.  

D’autre part, une fois le contenu identifié, l’internaute peut se retrouver bloqué car le texte intégral n’est pas accessible gratuitement (et là encore, les modalités d’accès diffèrent d’un éditeur à l’autre : achat à l’article, accès pour 24h, 48h, abonnement mensuel ou annuel…).

RECHERCHER DANS LA PRESSE EN LIGNE ET LES SITES D’ACTUALITES 

La seconde difficulté réside dans les modalités de recherche et d’accès à ces contenus. Interroger chaque site un à un serait bien évidemment extrêmement chronophage, d’autant que les moteurs de recherche proposés par chaque site sont rarement perfectionnés (certains ne permettent même pas d’utiliser les opérateurs booléens de base ou de consulter les résultats par ordre ante-chronologique !). 

Quelles solutions s’offrent donc à l’internaute pour interroger la presse en ligne ou les sites d’actualités ?

LES BASES DE DONNEES PRESSE : DE PLUS EN PLUS DE CONTENU WEB

Les bases de données presse : de plus en plus de contenu webDans le cadre de cet article, nous avons analysé la presse française web et les sites d’actualités disponibles dans les quatre agrégateurs presse les plus connus : EDD, Europresse, Factiva et LexisNexis.

EDD : DU CONTENU WEB RICHE MAIS DIFFICILE A DISTINGUER

EDD s’enrichit régulièrement en contenus web. Il propose à ce jour la plus grande palette de sources françaises, dont une petite partie sont des sources web. 

Mais leur identification n’est pas aisée : il n’existe en effet aucune possibilité pour n’afficher que les contenus web et limiter la recherche à ces titres, à moins de les cocher manuellement un à un . 

La seule solution consiste à repérer dans la liste des titres ceux qui se terminent par .fr (LeFigaro.fr par exemple), .com (Boursier.com) ou .info (on peut gagner un peu de temps en utilisant la fonction Ctrl F sur son clavier). Mais on passe à côté de quelques titres web comme Backchich, Mediapart ou Rue89, pour lesquels l’extension n’est pas indiquée.

Parmi ces sources web, on trouve le site de tous les titres de PQN (à l’exception de L’Humanité), d’une petite dizaine de titres de PQR (Le Berry Républicain, Le Parisien, Le Journal du Centre…), de 4/5 titres de PHR, d’une quinzaine d’hebdomadaires d’actualités (Nouvel Observateur, Le Point, Challenges…) et de titres de presse spécialisée (LSA, Le Moniteur du BTP, Usine nouvelle…). 

Le plus souvent, EDD propose la version web en plus de la version papier, mais il y a des exceptions. 

Pour Emballage Magazine par exemple, EDD dispose du contenu web mais pas de l’édition papier. 

On trouve également des sites qui ne proposent pas d’équivalent papier, comme Avinews.com, Grenews.com (presse locale de Grenoble), Ados.fr,Orserie.fr, Testepourvous.com, ainsi que quelques blogs comme les ceux des correspondants locaux de Libération par exemple.

Et chose étonnante – mais il s’agit peut-être d’une erreur de classement –, on trouve parfois la version papier dans une rubrique et la version web dans une autre.             

C’est le cas notamment de la Gazette des verts et de Réveil Vivarais, qui sont classés en PQR pour la version web et en PHR pour la version papier.

EDD est donc plutôt bien achalandé en matière de presse en ligne et sites d’actualités, mais il y a malheureusement un véritable problème de visibilité de ce contenu. 

EUROPRESSE : MOINS DE CONTENU MAIS PLUS FACILEMENT IDENTIFIABLE

Europresse propose environ 330 sources françaises, dont près de 80 sont des sources web. 
On retrouve dans les contenus d’Europresse des recouvre-ments avec ceux d’EDD, mais aussi des spécificités.

EDD dispose par exemple de La Croix et La Croix.com, tandis qu’Europresse n’offre que l’édition papier. Les sites proposés sont soit offerts en complément de la version papier (Le Berry Républicain ou L’Echo Touristique par exemple), soit de purs players web (Backchich, Mediapart…). 

Quelques titres ne sont disponibles qu’en version web, alors qu’une version papier existe bien en kiosque (La Haute Gironde, Le Journal du Médoc par exemple)

Repérer les sites web et limiter la recherche à ceux-ci est bien plus intuitif sur Europresse que cela ne l’est sur EDD : dans la liste des sources en effet, la quasi-totalité des sources web sont affublées d’une indication «(site web)». 

On peut également limiter la recherche aux sites web en choisissant «presse en ligne» dans la rubrique «type» disponible dans la recherche avancée, et croiser avec «France» dans la «provenance géographique» pour se limiter à la presse française. 

FACTIVA : BEAUCOUP DE CONTENU WEB, MAIS PLUS COMPLIQUE QU'IL N'Y PARAIT

Factiva, de son côté, propose plus de 550 sources françaises dont près de 250 sont des sources web, ce qui en fait le premier serveur de contenu web pour la France. 


Parmi ces sources, on trouve bien sûr les sites web des grands titres de presse français (Les Echos, Challenges, La Croix…), des sites d’actualités, des sites web (le site du CSA, de la Fédération française d’Athlétisme ou encore de Greenpeace), mais également de nombreux blogs comme le blog Skype, Canard Wifi ou encore le blog de Laurent Fabius. 

Factiva ratisse donc bien plus large que ses concurrents.

De prime abord, on pense pouvoir identifier facilement le contenu web proposé par Factiva et limiter la recherche à cette sélection. 

Dans la rubrique «sources», Factiva distingue les «publications» des «sites web». A priori, la presse papier devrait donc se trouver dans «Publications» et la presse en ligne dans «sites web». 

Malheureusement, la situation est légèrement plus compliquée…

Ainsi, LesEchos.fr se trouve dans «publications», tandis que L’Express est dans «sites web». Le Point quant à lui se retrouve dans les deux catégories et Evène se trouve dans «Publications», alors qu’il s’agit en réalité d’un site web. 

L’explication de cet imbroglio éditorial est en fait plutôt simple : «Publications» et «sites web» ne désignent pas le type de support, mais les modalités d’accès au document depuis Factiva. 

Les articles issus de «Publications» sont visualisables directement au sein de Factiva – soit en les affichant en html, soit en les exportant au format pdf, word ou xml – tandis que les articles issus de la rubrique «sites web» sont visualisables sur leur site d’origine (Factiva ne propose alors que le titre et les premières lignes et renvoie sur le site de l’éditeur pour le texte intégral).

LEXISNEXIS : PEU DE CONTENU WEB
 

En matière de presse française et plus particulièrement de presse en ligne, LexisNexis fait un peu figure de parent pauvre, avec environ 170 titres de presse française, dont seulement une dizaine de sites web. 

On trouve par exemple 01men.com, Boursier.com, Courrierinternational.com, LesEchos.fr, Environnement-online.com ou encore LePoint.fr.

QUELQUES ALTERNATIVES : GOOGLE ACTUALITES ET PICKANEWS

Lorsque l’on n’a pas accès aux agrégateurs mentionnés ci-dessus ou que l’on souhaite interroger plus de sources web que celles disponibles sur les serveurs, il existe plusieurs solutions alternatives, aucune d’entre elles ne pouvant cependant prétendre à l’exhaustivité. 

La première est d’interroger Google Actualités, le service gratuit de Google qui indexe les contenus web (mais une partie seulement !) de plusieurs milliers de sources d’actualités en langue française. Il est malheureusement impossible de connaître dans le détail le nombre de sources françaises et la liste des sources en question ; Google indique bien dans son aide qu’il recueille «les grands titres provenant de plus de 500 sources d'actualités en langue française dans le monde entier», mais ce chiffre n’a pas été mis à jour depuis le lancement du service, en juillet 2003 ! 

On constate néanmoins que les premiers résultats sont issus principalement des sites des grands titres de presse française (PQN, hebdomadaires d’actualités et PQR), des sites des radios et TV et de nombreux sites d’actualités. La presse hebdomadaire régionale et la presse professionnelle et spécialisée semblent en revanche peu représentées. 

De nombreuses sources sont pourtant indexées, mais l’algorithme de classement ne les met pas en évidence. On peut heureusement améliorer le classement de ces sources en paramétrant l’interface. Il faut pour cela, en étant «logué» avec son compte Google, choisir l’option «Personnaliser les actualités» (symbole d’un crayon)  puis cliquer sur «Options avancées», et «Ajouter une rubrique locale». Cette rubrique apparaîtra ensuite dans la colonne de gauche.

Si l’on créé par exemple une «rubrique locale» avec comme thème Lyon, on affiche dans les résultats des articles issus du Progrès, de Lyon Mag, de La Tribune de Lyon, de LyonCapitale.fr, etc.

En termes de fonctionnalités de recherche, on dispose ici des possibilités habituelles de Google (opérateurs booléens classiques, recherche d’expression exacte, recherche des termes dans le titre uniquement, restriction par date et par source), ce qui n’est déjà pas si mal, mais loin d’être aussi perfectionné que sur les serveurs.

Dernière alternative et pas des moindre : Pickanews, un moteur de recherche plurimédia qui indexe plus de 50 000 sources d’informations de presse écrite, audiovisuelle et internet en France et en Europe (voir Bases n°280 – mars 2011). 

Les sources web françaises proposées sont très nombreuses, mais aucune liste précise n’est disponible. 

Pour avoir une estimation du nombre de sources web françaises, nous avons effectué quelques recherches très généralistes dans le moteur et, à chaque fois, les résultats provenaient de plus de 1 500 sources Web différentes. 

La couverture est extrêmement large puisqu’on trouve aussi bien de la presse en ligne (PQN, PQR, PHR, hebdomadaires d’actualités, presse professionnelle et spécialisée) que des sites, blogs et forums divers et variés (les news de Yahoo!, Fortuneo.fr, Staragora.com, M6bonus.fr, jeunesump.fr, laposte.net ou encore le blog de la section locale du PCF de Vierzon). 

Pour ce qui est des fonctionnalités de recherche, on dispose dans un premier temps des opérateurs booléens classiques et de la recherche par expression exacte. 

On peut ensuite affiner les résultats par période (Pickanews ne conserve en théorie que trois mois d’archives, même si on peut trouver des archives de sites TV un peu plus anciennes), par pays, médias, sources, thèmes et nom de la source. 

Pour la presse en ligne et les sites d’actualités français, on pourra donc lancer sa recherche dans le moteur puis limiter au pays « France » et au média « internet ». 

Une fois la liste des résultats affichée, on pourra alors cliquer sur le titre de l’article, afin d’obtenir un extrait et un lien vers le texte intégral, sur le site d’origine. 

Pickanews présente donc de réels atouts pour rechercher au sein des actualités web, mais il est malheureusement un peu limité en termes de fonctionnalités de recherche et d’antériorité des archives.

Il est dommage pour les professionnels amenés à faire des recherches d’informations de privilégier uniquement la presse en ligne ou, à l’inverse, uniquement la presse papier. 

Car ces deux types de support sont généralement complémentaires ; surveiller uniquement la presse web en accès gratuit ne permettra nullement d’avoir une vison globale d’un sujet d’actualités. 

A contrario, se limiter aux sources papier conduira aux mêmes travers : passer à côté de sources qualifiées n’ayant pas d’équivalent papier, ne pas avoir accès aux commentaires d’internautes parfois très instructifs…

Et pour ce qui est de la recherche en elle-même, on constate qu’il n’existe pour le moment aucune solution idéale avec, d’un côté, des serveurs/agrégateurs de presse avec des fonctionnalités de recherche avancées mais un corpus web limité ou peu mis en valeur et, de l’autre, des services web mieux achalandés mais avec des lacunes en matière de fonctionnalités de recherche et d’antériorité des archives. 

La route est encore longue…


Carole Tisserand-Barthole
Publié dans le n° 289 de Bases (Janvier 2012)

Aucun commentaire:

Enregistrer un commentaire