Blekko.com : va-t-il réussir là où tant d'autres ont échoué ?

Nombreux sont les moteurs qui ont rêvé et rêvent encore de prendre la place de Google ; tous s’y sont cassés les dents, à l’image de Cuil (voir Netsources n°75 - juillet-août 2008), qui vient tout juste de fermer ses portes.
 
Ces échecs successifs n’ont pourtant pas découragé les plus téméraires et il n’est pas rare d’entendre parler çà et là dans les blogs ou la presse spécialisée de nouveaux projets ou lancements imminents. 


L’un des derniers en date s’appelle Blekko et a été lancé cet été en version bêta privée. L’un de ses premiers atouts repose dans le parcours plus qu’éloquent de ses fondateurs, Rich Skrenta et Mike Markson.
            
Rich Skrenta peut se vanter d’avoir été tour à tour créateur d’un des premiers virus informatiques en 1982, co-fondateur de l’annuaire Dmoz / Open Directory – qui s’appelait initialement Gnuhoo, avant son rachat par Netscape en 1998 – et co-fondateur du moteur d’actualités Topix. Il a d’ailleurs quitté ce dernier en juin 2007 avec 5 autres employés (dont Mike Markson) et s’est lancé dans la foulée dans son nouveau projet, le moteur Blekko.
            
 Quant à Mike Markson, il était le co-fondateur et le VP Business Development du moteur d’actualités Topix.
            
Une chose est sûre, Blekko dispose déjà de tous les pré-requis pour entrer dans la légende du Web : une petite équipe composée majoritairement d’hommes aux allures de geek, un projet développé dans un garage d’une banlieue pavillonnaire de San Francisco, un nom des plus énigmatiques et un slogan “Slash the Web”, qui semble annoncer un combat intergalactique.
            
 L’idée de départ était de proposer un moteur bien différent de ce qui existe actuellement, aussi bien en termes d’indexation que d’expérience de recherche pour l’utilisateur.
             
Parmi les dix commandements énoncés sur le site de Blekko, on pourra d’ailleurs y lire que “les résultats de recherche impliqueront les utilisateurs”, “les données de ranking ne seront pas gardées secrètes”, “la recherche avancée sera accessible”, “le spam – entendre par là les liens commerciaux – ne fera pas partie des résultats de recherche” ou encore que “la vie privée des internautes sera respectée”.
             
Blekko se positionne donc en opposition frontale avec la stratégie de Google, ce dont Rich Skrenta ne se cache d’ailleurs absolument pas. Il n’hésite pas à critiquer ouvertement Google et plus précisément son algorithme de classement, le PageRank, qui a, selon lui, “détruit le Web”.
             
Faisant preuve d’une certaine lucidité, les créateurs de Blekko ont compris qu’il ne servait à rien de  vouloir concurrencer Google sur certains aspects et notamment sur la taille de son index ou la vitesse d’obtention des résultats.
            
Blekko crawle et indexe donc à l’heure actuelle plus de 3 milliards de pages (Google ne communique plus sur le sujet depuis 2005, mais l’on peut penser que son index est au moins égal à celui du défunt Cuil, qui annoncait 120 milliards de pages...) et ne permet pas d’obtenir les résultats instantanément, à l’image de la nouvelle fonctionnalité de Google “Instant Search”. Cela ne l’empêche pas de disposer de nombreux atouts en matière de fonctionnalités de recherche et de stratégies à l’égard des internautes (implication des internautes dans les résultats du moteur, respect de la vie privée, souci de transparence, etc.).
            
LES SLASHTAGS, UNE SYNTAXE DE RECHERCHE NOVATRICE
             
Comme tout bon moteur qui se respecte, Blekko dispose de quelques fonctionnalités de recherche de base des plus traditionnelles : on peut utiliser l’opérateur AND (en entrant simplement deux mots séparés par un espace), les guillemets pour rechercher une expression exacte ou le – pour exclure un ou plusieurs termes de la recherche. En revanche, l’opérateur OR ne semble pas fonctionner sur l’index de Blekko. On remarque néanmoins que, lorsque Blekko ne trouve aucun résultat à la question dans son propre index, il élargit automatiquement la recherche à l’index de Yahoo!.
             
Le point fort de Blekko en matière de recherche se situe au niveau de sa syntaxe et notamment de son élément de base intitulé “slashtag” (représenté par un /), qui permet d’affiner les requêtes.
             
Chaque slashtag correspond à une liste de sites ou de pages web sur une thématique ou fait office d’opérateur de recherche avancée plus classique, comme limiter la recherche à un site, trier les résultats par date, chercher les liens pointant vers un site…        

Par exemple, le slashtag /astronomy contient des sites et pages spécialisés sur l’astronomie, /politics des sites abordant des sujets politiques, /news des sites d’actualités, /date permet de classer les résultats par ordre antechronologique et ainsi de suite.
             
Concrètement, si l’on entre la requête Swine flu /health, Blekko recherchera des informations sur la grippe A dans des sites spécialisés dans le domaine santé/ médical ;  si l’on écrit global warming /conservative, il affichera des résultats sur le réchauffement climatique obtenus dans des sites jugés conservateurs et une recherche sur Oil spill/forums fera émerger des résultats sur la marée noire issus de  forums uniquement.
Les slashtags disponibles se comptent par milliers, mais il faut bien distinguer ceux créés par l’équipe de Blekko de ceux créés par les utilisateurs.
            
LES SLASHTAGS CREES PAR BLEKKO
             
Blekko propose plusieurs centaines de slashtags qui se répartissent en deux catégories : les topics slashtags et les built-in slashtags.
             
Les premiers sont des slashtags qui regroupent des sites et pages sur un sujet précis, comme par exemple /airports, /allergies, /anthropology, /architecture, /law, /liberal, /nanotechnology…
             
On en dénombre environ 300.
             
Utiliser les topics slashtags revient en quelque sorte à effectuer une recherche par mot-clé sur les sites qui composent la rubrique d’un annuaire généraliste.
             
Nul doute que le passage de Rich Skrenta chez l’annuaire Dmoz lui ait laissé quelques marques indélébiles…
             
Les seconds correspondent à des opérateurs de recherche avancée plus classiques.
             
Ils permettent par exemple de limiter la requête à certains types de sites (/news pour les sites d’actualités, /blogs, /forums), de classer les résultats par date ou par pertinence (/date ou /rank), de recenser les liens pointant vers un site (/link), de rechercher sur un site en particulier (/site=www.nomdusite.com), d’intégrer des widgets dans les résultats (/map pour visualiser le résultat sur une carte, /weather pour voir apparaître une carte des prévisions météos…), de ne rechercher que via certains services (/amazon pour rechercher uniquement sur Amazon, /bing, /flickr, /twitter…) ou d’utiliser des raccourcis (/add pour créer un nouveau slashtag, /login pour se connecter à son compte…).
             
Ce système associe donc les atouts des annuaires en matière de classement thématique – grâce aux “topics-slashtags”   – avec les possibilités de recherche avancée des moteurs classiques, grâce aux “built-in slashtags”.
             
Cette combinaison permettra de réaliser des requêtes plutôt élaborées, en ajoutant plusieurs slashtags les uns aux autres.
             
Notons tout de même que l’ordre des slashtags n’a aucune importance sur le classement des résultats. On pourra ainsi écrire indifféremment global warming /date /blogs /environment ou global warming /blogs /environment /date  ou encore global warming /environment /date /blogs pour rechercher des informations sur le réchauffement climatique dans des blogs spécialisés sur l’environnement, et exiger que les résultats de recherche soient classés par date (du plus récent au plus ancien).
             
LES SLASHTAGS CREES PAR LES UTILISATEURS
             
Blekko offre une vision collaborative du Web en permettant aux utilisateurs de créer leurs propres slashtags, à la simple condition d’avoir créé un compte. Au mois d’août, peu de temps après l’ouverture de la version bêta, on dénombrait déjà plus de 5 000 utilisateurs et plus de  2 000 nouveaux slashtags.
             
Pour créer ses propre slashtags, il suffit de cliquer sur “Create a slashtag” en bas de la page d’accueil ou dans la colonne de gauche sur toutes les autres pages. Il faut alors entrer le nom du slashtag ; tous les noms sont autorisés, sauf ceux que l’on a déjà créés. Il est même possible – et c’est là le plus surprenant – de créer des slashtags portant le même nom que ceux de Blekko ou d’autres utilisateurs.
             
On entre ensuite plusieurs mots-clés qui définissent le slashtag, puis on ajoute un certain nombre de sites ou pages qui vont le composer, soit en utilisant le moteur de recherche disponible, soit en entrant à la main les URLs des sites ou en important un fichier texte ou OPML. Pour finir, il faut choisir si l’on souhaite que le slashtag soit privé ou public.
            
A titre de comparaison, la création d’un slashtag présente une similitude frappante avec la construction d’un moteur personnalisable comme Google CSE (voir “Moteurs personnalisables : une nouvelle génération d'outils de recherche Web”, Netsources n°66). La différence majeure, c’est que Google CSE n’est qu’une diversification parmi tant d’autres de Google – diversification qui n’est d’ailleurs pas du tout mise en valeur –, tandis qu’il s’agit de la base de fonctionnement de Blekko.
             
RECHERCHE DES SLASHTAGS
             
Pour trouver des slashtags correspondant à ses besoins, Blekko propose une rubrique Find slashtags, à laquelle on accède en bas de la page d’accueil ou dans la colonne de gauche sur toutes les autres pages.
            
La rubrique se décompose en trois onglets : Topics Slashtags (les slashtags thématiques déjà créés par l’équipe de Blekko), Built-in Slashtags (les autres slashtags créés par Blekko) et pour finir Users Slashtags (les slashtags créés par les utilisateurs).
            
Ce dernier onglet présente un défaut de taille, car il permet simplement de naviguer parmi les slashtags de chaque utilisateur ou d’effectuer une recherche sur les noms d’utilisateurs, mais pas sur les noms de leurs slashtags.
             
BLEKKO : ATOUTS ET FAIBLESSES
             
Blekko présente des atouts indéniables, aussi bien en termes de fonctionnalités que de vision stratégique. Rich Skrenta, de par son expérience passée, a su tirer parti des atouts des annuaires mais également des fonctionnalités avancées des moteurs de recherche.
             
Le concept de slashtag est à la fois simple à comprendre et à utiliser et permet d’effectuer des recherches qu’il est quasiment impossible de formuler et de réaliser sur un moteur classique : rechercher des informations sur le système de santé américain, dans des blogs ayant une vision plutôt conservatrice par exemple, peut vite devenir un véritable casse-tête...
             
Quant à la vision des fondateurs de Blekko, on ne pourra qu’apprécier cette volonté d’impliquer les utilisateurs dans les résultats du moteur, l’absence totale de bandeaux publicitaires dans les résultats – pour le moment du moins –, la possibilité d’éliminer des résultats à simple vocation commerciale (il suffit de cliquer sur le bouton “spam” en dessous du résultat pour que le site n’apparaisse plus dans les résultats de ses futures recherches) ou encore les nombreuses options permettant d’obtenir des informations de référencement.
            
Blekko n’est cependant pas exempt de quelques défauts majeurs, qui modèrent grandement notre enthousiasme.
             
UN ETONNANT SYSTEME DE PRIORITE
             
Au niveau de la recherche par slashtag, nous avons été quelque peu surpris par le système de priorité qu’il utilise.
             
En effet, si nous entrons une requête avec le slashtag /environment par exemple, Blekko vérifie dans un premier temps si nous avons créé un slashtag à ce nom. Si c’est le cas, il effectue automatiquement la recherche sur les sites que nous avons intégrés à ce slashtag, sans même indiquer qu’il existe un topic-slashtag de l’équipe de Blekko portant le même nom ou que d’autres utilisateurs en ont également créés sur cette thématique. 
             
En revanche, si n’avons créé aucun slashtag à ce nom, il va automatiquement faire porter la recherche sur le topic-slashtag du même nom créé par Blekko, mais sans indiquer que d’autres utilisateurs en ont éventuellement créés.
            
Les slashtags créés par les autres utilisateurs se retrouvent donc relégués dans les bas-fonds du moteur, puisqu’ils n’apparaissent dans les résultats de recherche que lorsqu’il n’existe aucun slashtag créé par l’utilisateur lui-même ou par l’équipe de Blekko.
             
UNE PROLIFERATION DE SLASHTAGS !
             
Une prolifération de slashtags qui risque de devenir ingérable
La multiplication progressive des slashtags créés par les utilisateurs pourrait vite avoir un effet pervers, d’autant que chacun peut leur donner un nom déjà utilisé.
             
On risque de voir proliférer des milliers de /environment, /movies, /health, /economy… qui n’auront aucune visibilité et aucune utilité. Peut-être serait-il préférable d’interdire l’utilisation d’un même nom par plusieurs personnes, mais de laisser la possibilité à chaque internaute d’ajouter ou de modifier des sources à un slashtag déjà existant (ce qui n’est pas le cas à l’heure actuelle).
             
Une intervention humaine de validation des nouvelles sources pourrait être une solution adaptée pour éviter tout débordement et tout ajout de contenu hors-sujet.
            
Cette validation pouvant être effectuée par les équipes du moteur ou par des internautes bénévoles, un peu à la manière des modérateurs sur Wikipédia.
             
Ce dédoublonnage pourrait également avoir un effet positif sur le problème de priorité évoqué précédemment. Pour chaque requête comprenant un slashtag, l’internaute rechercherait alors d’un seul coup sur les sources qu’il a lui-même ajoutées, les sources ajoutées par l’équipe de Blekko, mais également sur celles ajoutées par les autres utilisateurs.
            
LE RISQUE DE PASSER A COTE D’INFORMATIONS PERTINENTES
             
L’utilisation de slashtags délimite le périmètre de recherche à un corpus de sites bien définis et la recherche ne porte donc plus sur la totalité de l’index du moteur, comme sur les moteurs de recherche traditionnels.
             
Cela présente l’avantage de limiter le bruit et les sites hors-sujet, mais le risque de passer à côté d’informations pertinentes est bien réel, tout simplement parce les sites les hébergeant peuvent ne pas faire partie du corpus.
             
La qualité et la pertinence des sites contenus dans un slashtag conditionnent donc grandement la qualité des résultats de la recherche.
             
De même, le caractère subjectif de l’attribution d’un mot-clé peut produire le même effet.
             
Si l’on recherche par exemple des informations sur l’écologie, l’information intéressante peut tout aussi bien se trouver dans un slashtag /environment, /ecology ou encore /sustainable_development.
             
Faire porter sa recherche sur un seul slashtag peut s’avérer quelque peu réducteur. Pourquoi ne pas imaginer un monde où Blekko nous suggérerait des topics-slashtags proches de celui utilisé lors de notre recherche ?
            
Blekko n’en reste pas moins très prometteur, surtout pour un moteur qui n’en est qu’à sa première mouture publique.
             
Remplacera-t-il Google ? Probablement pas ; en tout cas pas dans l’immédiat et pas sans qu’un certain nombre de modifications et d’améliorations soient apportées.                         
Mais il peut constituer une alternative intéressante et bien plus appropriée que Google pour certains types de recherche.
             
Sa syntaxe fera sans nul doute le bonheur des professionnels de l’information, mais il n’est pas certain que les internautes lambda s’approprient – et surtout aient envie de s’approprier – ce nouveau langage qui, pour en tirer le meilleur parti, ne peut se satisfaire de 2 ou 3 mots-clés séparés par un simple espace. 


Carole Barthole

Publié dans le n°87 de Netsources (Juillet/Août 2010)

Aucun commentaire:

Enregistrer un commentaire