Yebol.com : un mixte de Google, de Yahoo! India et de Cuil...


Lancé en version bêta en juillet dernier, Yebol est un nouveau moteur qui utilise une base de connaissances, permettant aux internautes d’effectuer des recherches s’appuyant sur la sémantique.
             
Sa technologie a été développée par Hongfeng Yin, un ancien ingénieur de Yahoo! spécialisé dans l’intelligence artificielle, la reconnaissance de formes, le data mining et la recherche visuelle et conceptuelle.

        

A l’instar de la plupart des moteurs récents, la page d’accueil de Yebol est largement inspirée de celle de Google et se compose du logo (moyennement convaincant...) et d’une zone de saisie, surmontée de liens vers les modules Web, Images, Vidéos,  Actualités et, par défaut, Smart (Web “enrichi”).
             
La présentation des résultats est en revanche plus innovante et apporte de réels services à l’utilisateur.
             
En lieu et place de la sempiternelle liste linéaire de pages offerte par des moteurs tels Google, Yebol propose en effet différents types de résultats répartis dans des emplacements spécifiques.
             
On retrouve ici l’idée des “Glue Pages” offertes un temps par Yahoo! India (voir Netsources n°74, mai-juin 2008), idée qui n’a sans doute pas rencontré le succès escompté, puisque le site a repris un format plus traditionnel...
            
A titre d’illustration, une requête sur Yebol avec le terme “Web 2.0” affiche une page composée de différents ensembles,  présentés dans des colonnes et espaces :
            
- des Related Topics, sont disponibles  dans une colonne sur la gauche, et semblent relativement proches de la fonction “Exploration par catégories” de Cuil (voir Netsources n°75, juillet-août 2008).
            
La requête “Web 2.0” affiche ainsi les catégories et sous-catégories suivantes : Web 2.0 (Google Maps, Ruby on Rails, Social shopping, Social computing...), Computer programmers (Tim O’Reilly, Trevor Blackwell, Aaron Swartz...), American businesspeople (Larry Brilliant, Mark Zuckerberg, Jeff Bezos...), World Wide Web (Semantic Web, Web content...), etc.
             
Un clic sur l’un des termes relance la recherche sur ce terme seul (et non sur le terme initial + terme associé).

Cette clustérisation s’avère plutôt performante, du moins pour des termes assez génériques ;
              
- l’encadré Expanded Searches, sur la droite de l’écran, affiche quant à lui des expressions permettant de préciser la recherche (Web 2.0 Expo, Web 2.0 News...) ;
            
- les derniers tweets postés sur le sujet sont également affichés, dans la colonne de droite.
             
La partie centrale de l’écran est pour sa part occupée par :
          
- les “Top Sites” sur le sujet. L’idée de Yebol est ici d’identifier les sites – ou les parties de sites – répondant le mieux à la requête.
             
La recherche sur “Web 2.0” sélectionne notamment la page de Wikipédia sur ce thème, le chapitre “What is Web 2.0” de Tim O’Reilly (il constitue l’un des textes fondateurs du domaine), le congrès “Web 2.0 Summit”, etc.
            
- les titres d’actualité sur le sujet, issus de sources comme ZDNet, E-Commerce Times... ;
            
- les résultats web enfin avec, pour chaque page, son titre, le nom du site dont elle est issue, des liens correspondant aux divers “chapitres” de la page (un peu à la manière des SiteLinks de Google) et des tags caractérisant le contenu de la page ; ces derniers peuvent être cliqués pour relancer la recherche.
             
Si les tags peuvent apporter une aide réelle dans la formulation de la requête, l’absence d’extrait pertinent s’avère en revanche un peu déroutant, le titre ne permettant pas toujours de deviner l’intérêt de la page...
              
C’est dans la façon dont la page de résultats est construite que Yebol se distingue le plus de ses concurrents. Se situant à mi-chemin entre un annuaire et un moteur, Yebol ajoute en effet de l’intelligence humaine – pour l’analyse des contenus – à plusieurs algorithmes et associe clustering et catégorisation. Cela lui permet de générer automatiquement des concepts et des listes de sites, pour chacune des recherches des utilisateurs.
             
En utilisant le service cloud computing d’Amazon, Yebol a construit une base de connaissance contenant 10 millions de concepts et plus d’un milliard de pages web. Et ce n’est qu’un début, puisque sa technologie lui permet d’étendre sa base à 100 millions de concepts et 10 milliards de pages.
             
Au final, plutôt que d’offrir la classique liste linéaire de résultats, Yebol étend la recherche dans plusieurs dimensions : en “hauteur” – avec les “top sites” et les catégories –, en “largeur” – avec les related topics –, en longueur – les expanded searches – et en profondeur – liens et tags pour chaque résultat...
             
Cette politique peut s’avérer utile pour des questions relativement génériques, car le moteur offre alors à l’internaute plusieurs pistes pour préciser sa requête.
            
En revanche, Yebol ne s’avère guère adapté dès lors que la question est complexe ou très précise.
            
Aucune information n’est donnée sur les possibilités de recherche, mais nos tests semblent montrer que, si les opérateurs classiques (OR, intitle:, inurl:, site..) sont bien compris, la combinaison de différents opérateurs l’est beaucoup moins...

Béatrice Foenix-Riou
Publié dans le n° 82 de Netsources (septembre/octobre 2009)

Aucun commentaire:

Enregistrer un commentaire