• Contenu du site mis à jour le 16 avril 2024

Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Comment récupérer un flux RSS sur la majorité des sites web ?

Netsources no
159
publié en
2022.09
2191
Tags
Réduire Augmenter Taille de la police
Comment récupérer un flux RSS sur la majorité des sites ... Image 1
Comment récupérer un flux RSS sur la majorité des sites ... Image 1

Avant de vouloir à tout prix récupérer un flux RSS, il faut déterminer si la source et les contenus que l’on souhaite surveiller sont adaptés à ce format. Et si c’est bien le cas, il existe une méthode générale qui peut s’appliquer à tous les types de sources (sites web, moteurs, réseaux sociaux, bases de données, etc.) et que nous avons détaillée dans l’article « Comment déterminer la méthode la plus adaptée pour mettre une source en veille ? ».

Et puis, un peu comme en mathématiques, il y a tous ces cas particuliers où il y a juste des formules à connaître par cœur. Dans le cas des flux RSS, les cas particuliers se rencontrent quand on essaye de récupérer un flux RSS sur les réseaux sociaux ou encore certains types de sites Web. En guise de formule, nous aurons soit des URLs à connaître, dont on changera les paramètres selon ses besoins ; ou encore des outils très spécifiques qui ne fonctionnent que pour une source en particulier.

Comme il est impossible ou presque de retenir toutes ces formules par cœur, nous avons voulu dans cet article et les suivants rassembler en un seul et même endroit toutes les astuces, méthodes et outils à connaître, associés à chaque cas particulier.

Dans cet article, nous nous intéressons aux formules à connaître pour récupérer des flux RSS sur les sites Web de ses concurrents, de blogs, des sites de presse, des sites institutionnels, etc.

Toutes les formules et outils cités ont été testés et fonctionnaient au mois d’août 2022.


Lire aussi : 

Quel lecteur de flux RSS choisir en 2020 ?

RSS, Twitter, Facebook, LinkedIn et les autres: surveille-t-on vraiment la même chose ?


La majorité des sites Web ont un point commun qui permet de récupérer automatiquement un flux RSS

La majorité des sites Web sont construits à partir des quelques systèmes de gestion de contenus présents sur le marché comme Wordpress, Drupal, Joomla, Wix, etc. On les appelle des CMS (Content Management System).

On ne le sait pas toujours, mais nombre de ces CMS proposent nativement des flux RSS. Il suffit juste de connaître la « formule magique » pour récupérer les flux RSS associés à chaque CMS et le tour est joué.

Mais encore faut-il savoir quel CMS est utilisé pour tel ou tel site Web.

Le cas le plus simple, c’est bien évidemment quand le nom du CMS apparaît dans l’URL du site comme par exemple www.monblog.wordpress.com. Là, il n’y a aucun doute.

Mais dans de nombreux cas, cette indication n’apparaît pas dans l’URL, car les créateurs de sites ont acheté des noms de domaines personnalisés. Comment faire ?

tags

Déjà abonné ? Connectez-vous...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...