Topsy.com : un moteur de recherche temps réel gratuit et permormant

Topsy est un moteur de recherche social qui indexe les résultats des outils de microblogging Twitter et Google+, ainsi que d’autres résultats web, comme des articles de presse en ligne par exemple, ayant été repris sur Twitter ou Google+ sous forme de lien (URL raccourcie). 

Topsy est loin d’être nouveau puisqu’il a été lancé aux Etats-Unis en mai 2009 ; mais il a connu depuis de nombreuses évolutions, dont l’ajout de Google+ (en octobre 2011) et d’un outil d’analyse, qui en font aujourd’hui un moteur très intéressant.

Contrairement à de nombreux outils qui proposent une antériorité très limitée des archives de Twitter, Topsy peut se vanter d’avoir un index de tweets remontant à mai 2008, même si la couverture n’est pas exhaustive. Avec la disparition de Google Realtime Search en juillet 2011 (voir Netsources n°92), Topsy est donc une excellente alternative, gratuite qui plus est. 

L’interface d’accueil du moteur est épurée avec une simple zone de recherche, ainsi qu’une liste des tweets les plus en vus le jour même. 

En haut à gauche de l’écran, on peut déjà préciser si la recherche doit porter sur tous les types de sources, sur les liens uniquement (c’est-à-dire des pages web qui ont été reprises sur Twitter sous forme d’URL raccourcie ou de lien), les tweets uniquement, les photos, les vidéos ou les experts (ce qui revient à rechercher des twitteurs spécialisés sur un sujet ou une thématique). Il n’est pas forcément nécessaire de limiter la recherche à ce stade, car il est toujours possible de le faire dans un deuxième temps, après affichage des résultats. 

Un dernier bouton en haut à gauche, intitulé « trending », permet quant à lui de visualiser les liens les plus souvent repris sur Twitter (par défaut, il s’agit du top 100, mais on peut ensuite sélectionner dans la colonne de gauche le top 1 000, 5 000 ou 20 000). 

Dans la colonne de gauche toujours, on a la possibilité de sélectionner le top des tweets, des photos ou des vidéos, de filtrer par mot-clé, mais également par langue (tout, anglais, allemand, chinois, portugais, espagnol, français, russe et thailandais). Cela permet de se faire une première idée des sujets les plus «tendances» à un moment donné. 

Le moteur peut être interrogé de deux manières, soit en passant par l’interface simple, soit par la grille de recherche avancée. 

Dans l’interface standard, on peut utiliser les opérateurs classiques (AND par défaut, OR et NOT, représenté par le symbole –) et les guillemets pour une expression exacte. 

On dispose de plus des fonctionnalités de recherche suivante : # pour limiter la requête aux hashtags, from: pour rechercher les tweets publiés par un twitteur en particulier, @ pour les tweets faisant référence à un utilisateur donné et site: pour repérer les tweets contenant un lien vers tel site. 

L’interface avancée dispose sensiblement des mêmes fonctionnalités de recherche, avec en plus la possibilité de limiter à certains types de résultats (liens, tweets, photos ou vidéos), certaines langues (10 sont disponibles) et à un intervalle de dates. 

Une fois les résultats affichés, de nombreuses fonctionnalités de filtrage sont offertes dans la colonne de gauche. 

On peut tout d’abord visualiser les résultats les plus récents, classés par ordre antechronologique (latest results) ou les résultats parus au cours de la dernière heure, du dernier jour, des 7 derniers jours, des 30 derniers jours ou bien depuis toujours (soit depuis mai 2008). 

Il est intéressant de constater que Topsy indique à côté de chaque période (1 jour, 1 mois, etc) le nombre de résultats générés, ce qui permet d’effectuer des comptages sur le volume généré dans le temps par un ou plusieurs mots-clés. 

On dispose d’autre part des filtres suivants : type de résultats (avec tout, liens, tweets, photos, vidéos ou experts), réseau (Twitter ou Google+) – Twitter est sélectionné par défaut et il est impossible de faire porter la recherche sur les deux réseaux en même temps), classement des résultats (pertinence par défaut ou date) et langue (anglais, chinois, japonais, coréen, russe, allemand, espagnol, français, portugais et turc). 

Dans une perspective de veille, on peut ensuite s’abonner aux résultats de cette recherche par mail (create email alert) ou par flux RSS (suscribe to this results). Et pour finir, on peut également partager ces résultats sur Twitter. 

Topsy se targue d’avoir l’un des plus grands index de tweets (avec des archives remontant jusqu’à mai 2008) mais, après quelques tests, nous avons pu constater que ces archives ne sont pas complètement exhaustives. 


En recherchant par exemple tous les tweets publiés par l’équipe de FLA Consultants (@flateam) depuis la création du compte, en 2010, nous avons identifié 1 340 tweets avec Topsy, là où notre compte Twitter en indique 1 767. Cela étant, Topsy reste l’un des rares outils gratuits à proposer une telle antériorité dans ses archives. 

Depuis janvier 2011, Topsy propose également un outil d’analyse «Topsy Social Analytics» – lui aussi gratuit – qui ne manque pas d’intérêt, surtout pour les personnes cherchant à évaluer les effets d’un buzz, ou tout simplement à obtenir quelques statistiques. On notera que cet outil ne fonctionne que pour Twitter, et non pour Google+. 

On accède à cet outil via la liste des résultats de recherche de Topsy, en cliquant sur le graphique à droite de l’écran ou bien directement en se rendant à l’adresse http://analytics.topsy.com/

L’outil permet de rechercher et de comparer jusqu’à 3 requêtes différentes. Les possibilités de recherche présentées précédemment pour le moteur Topsy fonctionnent également ici. On peut donc rechercher et comparer le volume d’informations généré par plusieurs mots-clés, par plusieurs hashtags (#),faisant référence à plusieurs twitteurs (@) ou pointant vers plusieurs sites (domain.com:). On peut effectuer la recherche sur 1 jour, 1 semaine, 2 semaines ou 1 mois. Les résultats sont ensuite présentés sous forme d’un graphique avec les dates sur l’axe des abscisses et le volume généré sur l’axe des ordonnées. Il est clairement précisé que l’outil ne prend pas en compte l’intégralité des tweets, mais uniquement ceux qui sont «significant» – c’est-à-dire qui ont été retwittés ou qui contiennent un lien – ou valides. 

On va par exemple pouvoir comparer le volume généré par les mots-clés Agnel, Muffat et Manaudou (nageurs français aux JO) au cours des deux dernières semaines et voir que l’enthousiasme a été de courte durée (pic de tweets lors des médailles d’or de Yannick Agnel et Camille Muffat, puis volume qui retombe presque à 0 après quelques jours). 

Voici également quelques autres exemples de recherche : 
  • From:nom_du_twitteur (ex.: from:bfoenix) permet de visualiser le nombre de tweets postés chaque jour par un twitteur, au cours des dernières semaines ;
  • Lemonde.fr affiche les tweets pointant vers le site du Monde chaque jour ; 
etc.

En dessous de chaque graphique, on peut visualiser un tableau (exportable au format .csv) qui reprend les liens les plus fréquemment repris sur Twitter au cours des dernières 24h. Le tableau indique le nombre de tweets incluant ce lien, puis plusieurs indices (influential, momentum, velocity et peak), mais les explications fournies sur ces indices restent assez opaques. 



Carole Tisserand-Barthole
Publié dans le n° 98 de Netsources (Mai-juin 2012)

Aucun commentaire:

Enregistrer un commentaire