Yahoo ! Pipes au services de la veille

Yahoo! Pipes est un outil de traitement de données qui a été lancé par Yahoo! en février 2007.
             
Il est assez difficile d’en donner une définition simple et précise, tant ses fonctionnalités sont nombreuses. Mais pour le sujet qui nous intéresse, à savoir la veille, on pourra le présenter comme un outil permettant d’optimiser l’utilisation des flux RSS, grâce notamment aux possibilités qu’il offre de fusionner plusieurs flux entre eux, de les filtrer par mots-clés, de les dédoublonner, de générer des flux sur des pages qui n’en ont pas, etc.

Au cours des dernières années, nous avons souvent eu l’occasion de présenter ou de citer dans Netsources des outils offrant des fonctionnalités similaires, comme RSS Mix ou FeedInformer pour mixer des flux, RSS Bang ou FeedRinse pour les filtrer ou encore Dapper, Ponyfish et Feed43 pour en créer sur des pages qui n’en ont pas.
             
Mais ces outils ont un défaut majeur : ils ne proposent le plus souvent que l’une des fonctionnalités et ils ont une fâcheuse tendance à disparaître du jour au lendemain sans prévenir.
             
Yahoo! Pipes quant à lui est plus pérenne, puisqu’il existe depuis déjà cinq ans, dispose d’une communauté d’utilisateurs plutôt actifs et vient même de passer à la V2 au cours de l’été 2011.
             
Si les récents changements de stratégie de Yahoo! (arrêt de certains services et vente d’activités comme Delicious par exemple) ont pu nous laisser présager le pire, il semble que l’avenir Yahoo! Pipes ne soit pas menacé, tout au moins pour le moment.
             
De prime abord, Yahoo! Pipes peut paraître extrêmement complexe, voire même totalement inabordable, en raison du nombre très important d’options  proposées sur l’interface.
             
Mais l’on peut aussi accepter l’idée de ne jamais maîtriser l’intégralité des fonctionnalités,  se contenter d’apprendre à utiliser celles qui peuvent réellement être utiles et tirer parti des nombreux guides et tutoriaux gratuits disponibles sur le Web ; tout devient alors beaucoup plus facile, voire même plutôt simple.
            
Dans cet article, nous nous en tiendrons à des utilisations simples de l’outil dans une perspective de veille, même s’il faut garder à l’esprit qu’il est possible d’aller beaucoup plus loin.
             
PRESENTATION DE L’INTERFACE
             
Avant toute chose, il faut se rendre sur l’interface de Yahoo! Pipes (http://pipes.yahoo.com/pipes/) et  créer un compte yahoo – si l’on n’en dispose pas déjà –, en cliquant sur «Join Now», en haut à droite de l’écran. Si l’on a déjà un compte, on cliquera alors sur «Sign In», juste à côté.
             
Une fois connecté, on clique sur le bouton bleu en haut de l’écran «Create a Pipe». Notons qu’un Pipe est l’élément de base de l’outil et correspond à une sorte de tuyau, permettant de créer un flux de sortie à partir de flux d’informations entrants, sur lesquels ont été appliqués différentes actions (mixage, filtrage, dédoublonnage, etc).
             
On arrive alors sur l’interface d’administration de l’outil, c'est-à-dire le cœur du système.
             
La colonne de gauche fait office de boîte à outils et l’on y retrouve l’intégralité des fonctionnalités disponibles (sous forme de modules) regroupées par catégories ; l’écran central est le lieu de création des pipes et le bas de l’écran, le «debugger», permet de visualiser le contenu du pipe et donc de vérifier si le résultat est bien conforme aux attentes.
             
Yahoo! Pipes apporte une réelle valeur ajoutée dans le cadre d’une veille et bon nombre de ses fonctionnalités peuvent être utilisées dans cette perspective.
             
Nous nous attarderons ici sur deux fonctions qui nous semblent essentielles dans la mise en place d’un processus de veille, à savoir les méthodes pour mixer et filtrer des flux par mot-clé ; ces fonctions ont d’autre part comme atout d’être parmi les plus simples à mettre en pratique sur Yahoo! Pipes.
             
MIXER PLUSIEURS FLUX
             
La première action consiste bien évidemment à ajouter les différents flux que l’on souhaite mixer.
            
Pour cela, on choisit le module «Fetch Feed» dans la rubrique «Sources» de la colonne de gauche, que l’on dépose dans l’écran central grâce à un glisser-déposer.
             
On voit alors apparaître le module composé d’une zone de saisie, pour y mettre l’URL d’un flux RSS.
             
On remarque qu’un deuxième module intitulé «Pipe Output» est apparu en bas de l’écran central : ce module est indispensable et ne doit surtout pas être supprimé. Sans lui, impossible de récupérer un flux de sortie !

On collera donc l’URL d’un premier flux RSS dans la zone de saisie du module «Fetch Feed», puis on cliquera sur le petit + pour ouvrir une deuxième zone de saisie et coller un deuxième flux. Et ainsi de suite…
              
Si le nombre de flux à mixer est très important, on peut ajouter plusieurs modules «Fetch Feed» au lieu de mettre toutes les URLs dans un seul et unique module.
            
Il faut simplement penser à réunir les différents modules entre eux pour que Yahoo! Pipes mixe bien le contenu de tous les flux présents. Pour ce faire, il suffit d’aller chercher le module «Union» dans la rubrique «Operators», toujours dans la colonne de gauche, puis de le placer en dessous des modules «Fetch Feed». On relie alors les petits ronds disponibles en dessous de chaque module «Fetch Feed» aux ronds présents au dessus du module «Union».
              
Si les différents flux choisis risquent de présenter des doublons, on peut très simplement les dédoublonner en utilisant le module «Unique» disponible dans la rubrique «Operators», que l’on place alors en dessous de «Union» ou en dessous de «Fetch Feed» (si un seul module «Fetch Feed» a été utilisé).
             
Au sein du module «Unique», on détermine dans la liste déroulante si l’on souhaite dédoublonner les résultats ayant le même auteur (item.author), la même description (item.description), pointant vers la même page (item.link), ayant la même date de publication (item.pubdate) ou le même titre (item.title).
             
Puis on relie le module Union au module Unique.
             
L’étape suivante consiste à déterminer le format du flux de sortie. Pour cela, on ajoute un module «Sort» disponible dans la rubrique «Operators» puis, au sein de ce module, on choisit dans la liste déroulante si les résultats doivent être classés par auteur, description, URL, date ou titre et par ordre croissant ou décroissant.
             
Notons que pour obtenir un flux RSS de sortie classique avec des résultats classés par ordre antechronologique, il faudra choisir un classement par date et par ordre décroissant.
            
Pour finir cette étape, on relie les modules «Unique» et «Sort».
             
Pour terminer le pipe, on relie ensuite le module «Sort» au module «Pipe Output», on clique sur «Save» en haut à droite de l’écran, on choisit le nom du Pipe et on clique ensuite sur «Run Pipe» en haut de l’écran.
             
Yahoo! nous ouvre alors une page présentant le contenu du flux nouvellement créé. Si cela convient, il ne reste plus qu’à cliquer sur «Get as RSS» pour récupérer le flux et aller s’y abonner dans son agrégateur.
             
FILTRER UN OU PLUSIEURS FLUX
             
Comme présenté précédemment, on commence par glisser / déposer un module «Fetch Feed» dans l’écran central, et l’on saisit une ou plusieurs URLs de flux RSS.
             
On ajoute ensuite un module «Filters» présent dans la rubrique «Operators».
              
Ce module va permettre de définir précisément les critères du filtre et notamment si l’on souhaite conserver ou éliminer les items répondant à certains critères et si les critères sont séparés entre eux par un AND ou un OR.
             
Dans un second temps, on choisit si les mots-clés doivent être recherchés dans le champ auteur, description, URL, date ou titre, puis on entre les différents mots-clés.
             
Comme lors de la démonstration précédente, on peut ensuite mettre un module «Unique» pour dédoublonner les résultats le cas échéant et un module «Sort» pour classer les résultats par ordre antéchronologique.
             
Puis l’on relie les différents modules entre eux, avant de cliquer sur «Save» et récupérer le flux RSS de sortie. Bien évidemment, ces deux fonctionnalités peuvent se combiner et l’on peut par exemple mixer différents flux préalablement filtrés.
            
Au final, on constate que mixer et filtrer des flux n’est pas aussi compliqué que ne le laissait supposer l’interface de Yahoo! Pipes.
             
AUTRES FONCTIONNALITES
             
Dans une perspective de veille, Yahoo! Pipes pourra également permettre de réaliser un grand nombre d’autres actions plus ou moins complexes et notamment de créer des flux RSS sur des pages qui n’en ont pas.
             
Le résultat est tout à fait satisfaisant, mais la prise en main est loin d’être aussi simple que lors des exemples précédents, la difficulté résidant dans le fait qu’il faut savoir utiliser la structure html de la page. Allergiques ou  novices en html s’abstenir !
             
Pour avoir de plus amples informations sur l’utilisation de Yahoo! Pipes dans le cadre d’une veille, pour découvrir d’autres fonctionnalités ou pour visualiser en vidéos les différentes actions à accomplir, on conseillera la consultation des ressources suivantes :
            
- Bibliothèques [ reloaded]
             
Plusieurs tutoriaux en vidéo : http://goo.gl/lLzQ2 ;
             
L’Oeil au Carré :
            
«Yahoo Pipes : des infos dans le tuyau»  http://goo.gl/zoAd9 ;

Intelligences Connectées :
            
«Yahoo Pipes: Colonne vertébrale d’une plateforme de veille multilingue, performante et gratuite»  http://goo.gl/hQN8W ;
            
- CaddERéputation
             
«Comment filtrer un compte Twitter par mots-clés ?»  http://goo.gl/Fhl4i.



Béatrice Foenix-Riou
Publié dans le n° 93 de Netsources (Juillet/Août 2011)

Aucun commentaire:

Enregistrer un commentaire