Evri search : un moteur pas comme les autres


Basée à Seattle et créée en 2007, la société Evri propose deux moteurs de recherche – Evri.com et Evri search –, permettant tous deux d’effectuer des recherches sur les sites d’actualités anglo-saxons (même si l’on peut tout de même trouver de temps à autre du contenu non anglophone, issu notement de sites comme Lemonde.fr ou Latribune.fr).

            
EVRI.COM : LE MOTEUR GRAND PUBLIC - www.evri.com/
             
Le moteur disponible sur la page d’accueil est résolument orienté très grand public. Les fonctionnalités offertes sont bien moindre que celles d’Evri search, mais l’interface est conviviale et facile à prendre en main.
             
La page d’accueil propose une liste des principales actualités du jour et l’on peut également consulter les actualités classées par thématiques (US & World, Entertainment, Sports, Business, Technology...), qui sont ensuite divisées en sous-catégories.
             
L’atout d’Evri.com réside dans sa capacité à reconnaître des entités nommées (nom de personnes, villes, pays, films, entreprises…).
             
Lorsque l’on entre un mot-clé, Evri déploie une liste de suggestions afin d’identifier la bonne entité, ce qui permet notamment de résoudre les problèmes d’homonymie.
             
Si l’on entre le terme Orange par exemple, on dispose d’une liste d’entités où Orange peut être le nom d’une société, le nom d’une ville, d’un album, d’un livre…
             
Une fois la bonne entité choisie, les résultats apparaissent au centre de l’écran et sont répartis dans différentes rubriques : Actualités, résultats dans Twitter, citations et vidéos. Dans la colonne de droite, on dispose également d’une cartographie représentant les principaux liens que cette entité entretient avec d’autres, un graphique avec le nombre de fois où le sujet a été abordé au cours des 30 derniers jours, une description issue de Wikipédia, etc.
             
A de rares exceptions près, le résultat est tout à fait pertinent et concerne bien l’entité choisie. Au niveau des opérateurs traditionnels, seuls le AND et le OR sont disponibles.
             
En raison de sa nationalité, le moteur dispose d’une excellente couverture des entités américaines. Quelques tests pour la France montrent cependant qu’il en reconnaît tout de même un certain nombre, malgré quelques surprises : la plupart des personnalités du monde politique français, les grandes entreprises, etc.
             
Néanmoins, on ne pourra que sourire en voyant que pour Daniel Cohn-Bendit, il nous propose une entité “Daniel Cohn-bendit : musician and politician”, qui correspond pourtant bien au leader d’Europe Ecologie.
             
EVRI SEARCH : UN MOTEUR QUI IRA LOIN
www.evri.com/mainline-ui/jsp/index.jsf
            
Le second moteur, Evri search, permet d’aller beaucoup loin dans la recherche, mais n’est absolument pas mis en valeur par la société.
Il est très difficile – voire même impossible – de le retrouver depuis la page d’accueil d’Evri et le design de l’interface a de quoi faire fuir la grande majorité des internautes.
            
Sur la page d’accueil d’Evri search, il est précisé que cette interface est celle utilisée par les ingénieurs et informaticiens d’Evri pour effectuer des tests et améliorer le premier moteur. On comprend donc mieux cet aspect peu attrayant…
             
Evri search nous permet d’interroger le Web d’une façon inhabituelle mais très performante. Au lieu d’entrer une requête constituée d’une suite de mots-clés, il s’agit ici d’interroger l’actualité grâce à un langage bien particulier, permettant de structurer précisément son besoin.
             
Pour chaque requête, il faut lui indiquer une source, une action et une cible, un peu comme si l’on construisait une phrase avec un sujet, un verbe et un complément.
            
Les requêtes s’écrivent de la manière suivante : sujet > action > cible. Le sujet peut être une personne, un lieu ou une chose, l’action doit absolument être matérialisée par un verbe d’action écrit à l’infinitif – speak, win, acquire..., le moteur se chargeant ensuite de conjuguer et d’élargir aux synonymes – et la cible est une personne ou une chose vers qui l’action est dirigée.
             
Si l’on souhaite retrouver des actualités où Sarkozy critique Obama, on écrira Sarkozy > criticize > Obama ; si l’on désire trouver des articles parlant du rachat de la Dresdner Bank par la Commerzbank, on entrera Commerzbank > acquire > Dresdner Bank.
             
Les résultats sont ensuite présentés d’une manière peu habituelle : au lieu d’avoir une liste d’articles classés par ordre antéchronologique, les résultats se présentent sous la forme de lignes où l’on trouve la date de l’événement, le sujet -> l’action -> la cible. Tous les articles parus à la même période et ayant le même sujet, la même action et la même cible, sont rassemblés dans la ligne correspondante et il suffit de cliquer sur le + à droite de la date pour visualiser l’ensemble de ces articles (on dispose alors du titre et des mots-clés en contexte).
             
Parmi les nombreuses fonctionnalités offertes, on retrouve la majorité des possibilités de recherche traditionnelles : le AND, le OR et le NOT (écrit AND NOT) et les guillemets pour l’expression exacte, et mieux encore, la troncature (? pour remplacer un caractère et * pour en remplacer un nombre illimité n’importe où dans le mot) et un opérateur de proximité ("malignant cancer" ~10 pour rechercher les deux termes à 10 mots d’intervalle maximum).
            
Comme il s’agit d’un moteur sémantique, on ne s’étonnera pas de voir que le moteur élargit automatiquement la recherche aux variantes et synonymes. Si l’on souhaite rechercher une forme spécifique d’un mot, il faudra alors penser à utiliser les guillemets.
             
Par défaut, la recherche s’écrit sujet > action > cible mais l’on peut également orienter les flèches dans l’autre sens pour inverser les rôles : on pourra écrire Sarkozy <> criticize <> Obama pour retrouver les articles où Sarkozy critique Obama, mais ceux où Obama critique Sarkozy.
             
Evri permet également d’ajouter des compléments à la structure de base sujet > action > cible. Pour cela, deux compléments sont disponibles : PREP CONTAINS et CONTEXT CONTAINS.
             
PREP CONTAINS permet de préciser la recherche en indiquant un complément circonstanciel de temps, lieu, manière, etc. On pourra écrire Merkel > host > Obama PREP CONTAINS Berlin pour retrouver des articles où Angela Merkel a accueilli Obama à Berlin. Quant à CONTEXT CONTAINS, la définition donnée par l’aide en ligne d’Evri n’est malheureusement pas très explicite. Toujours est-il que le fonctionnement est à peu près similaire à celui de PREP CONTAINS, mais le nombre de résultats supérieur. Le mieux reste donc de tester les deux.
            
Mais Evri va encore plus loin en permettant aussi d'interroger le contenu de sa taxonomie. 

Evri reconnaît environ 250 entités réparties en 9 grandes catégories, ainsi que de nombreuses sous-catégories : Computer, Event (politique, sportif…), Location (adresse, ville, pays, montagne…), Numeric (téléphone, pourcentage, somme d’argent…), Organization (compagnie aérienne, groupe industriel, cabinet d’avocats, parti politique…), Person (homme politique, criminel, économiste, prix nobel…), Product (film, album, ordinateur, véhicule…), Temporal (date, durée…).
             
L’ensemble des entités disponibles est listée dans l’aide en ligne.
            
L’utilisation des entités pourra s’avérer très utile pour répondre à des questions du type qui, que, quoi, où, combien, quel… lorsque l’on ne connaît pas le sujet, la cible ou les compléments circonstantiels.
            
Voici donc quelques exemples d’utilisations possibles de la taxonomie :
            
- Essilor > acquire > [organization/name] pour savoir quelles sociétés ont été rachetées par Essilor ;
            
- [politician] > die > * CONTEXT CONTAINS 2009 pour savoir quels hommes/femmes politiques sont morts en 2009 ;
            
- [person] > win > oscar : pour connaître les gagnants des Oscars ;
            
- Commerzbank > acquire > Dresdner Bank PREP CONTAINS [money] pour connaître le montant de la transaction pour le rachat de la Dresdner Bank par la Commerzbank ;
            
- Obama > visit > [Country] CONTEXT CONTAINS 2009 pour savoir dans quels pays Obama s’est rendu en 2009.
            
Le langage d’interrogation d’Evri search, quoique un peu surprenant de prime abord, se révèle vite très intuitif et facile à prendre en main.
             
On perçoit bien les nombreuses potentialités offertes par ce moteur, qui sait habilement mêler fonctionnalités de recherche sémantique et fonctionnalités plus traditionnelles.
             
Espérons qu’à l’avenir, le corpus s’étendra à des sites d’actualités non anglophones et que les créateurs d’Evri search n’auront pas la mauvaise idée de supprimer ce moteur au profit de l’outil grand public, qui est certes intéressant mais nettement moins perfectionné sur le plan des fonctionnalités de recherche.
             
Et après quelques tests sur Evri search, on se surprendra à rêver d’un monde où les moteurs de recherche et les bases de données disposeraient tous d’une technologie similaire, ce qui constituerait une avancée majeure pour les professionnels de l’information.
            
Mais après tout, cette pensée n’est peut-être pas si utopique…



Carole Barthole
Publié dans le n°85 de Netsources (Mars/Avril 2010)

Aucun commentaire:

Enregistrer un commentaire