Actualité "Googlienne"

L’actualité «Googlienne» ne s’est pas ralentie à l’approche de l’été, et le moteur a beaucoup fait parler de lui ces derniers mois ; nous reviendrons dans cet article sur deux nouveautés qui nous semblent importantes pour les professionnels de l’information... 

GOOGLE INTEGRE LA SEMANTIQUE A SES ALGORITHMES AVEC LE KNOWLEDGE GRAPH

Lorsqu’on lance une recherche sur Google Web, on obtient depuis toujours une page de résultats affichant la liste des pages sélectionnées, classées par pertinence, avec pour chacune son titre, son URL et un extrait contenant les mots de la requête dans leur contexte.

En mai dernier, Google a annoncé officiellement sur son blog le lancement du Knowledge Graph (//goo.gl/mjNBY), première étape vers une nouvelle génération d’outil de recherche qui va faire passer Google «d’un moteur d’information à un moteur de savoir».

Concrètement, le Knowledge Graph permet d’obtenir, dans la page de résultats et en complément des pages pertinentes, un encadré sur la droite affichant directement des réponses à la question – quand les résultats traditionnels offrent des liens vers des pages contenant les mots de la requête. 

Après la «prédiction des recherches» (Google Instant Search, voir Netsources n°87), Google entend donc fournir des informations-clés qui, dans certains cas, pourront suffire à l’internaute... 

Pour ce faire, Google applique des algorithmes sémantiques, qui lui permettent d’identifier des relations entre des «entitées nommées» – personnes, entreprises, lieux, films...–, qui peuvent être éparpillées sur le Web, et les agrège ensemble. 

Il utilise pour cela des informations issues à la fois de sources telles que Wikipedia, la base Freebase, le CIA World Factbook..., mais aussi des milliards de requêtes qu’il a pu analyser ces dernières années. 

L’ensemble représente une base de données de 500 millions d’objets et de 3,5 milliards de faits et de relations entre ces objets. 

A titre d’illustration, si l’on interroge Google.com – le Knowledge Graph n’est pour le moment déployé que sur la version internationale – avec la requête «Picasso», on affiche sur la partie droite un encadré fournissant une brève biographie (de Wikipedia), une photo (issue d’un blog), les dates et lieux de naissance et de décès du peintre, le nom de ses femmes et de ses enfants, les images de quelques-uns de ses tableaux, et les recherches «similaires» effectuées sur le Web, concernant ici Vincent Van Gogh, Salvador Dali, Henri Matisse... 

Les nombreuses informations connexes (ville de naissance et de décès, noms des épouses et enfants, noms des tableaux...) sont assorties de liens, qui relancent la recherche sur Google et affichent les Knowledge Graph de ces différentes entitées (avec par exemple, pour une ville : la carte, la population, la superficie, le climat... et, pour un tableau, la date d’achèvement, le type de tableau, les dimensions, la période...). 

Avec le Knowledge Graph, Google poursuit donc plusieurs objectifs : 
  •  il permet à l’internaute d’obtenir rapidement une information pertinente, et l’aide le cas échéant à «désambiguïser» sa requête ; en cas d’homonymie par exemple, il peut en effet proposer plusieurs choix (l’Etat et la rivière pour une requête sur «Mississippi», la capitale française et l’hôtel-casino à Las Vegas pour «Paris»...) ;
  • il fait honneur à la sérendipité et incite l’internaute – par le biais des nombreux liens proposés dans l’encadré – à rester plus longtemps sur Google, lui offrant par là même davantage d’occasions de cliquer sur les liens sponsorisés...
  • il met en place un affichage qui devrait s’avérer très efficace pour les recherches effectuées depuis un terminal mobile (smartphones, tablettes..) ;
  • il met en avant son service Google+ : lorsque la recherche porte sur le nom d’une personne, sous la forme «prénom nom», le Knowledge Graph affiche quelquefois exclusivement des informations issues du profil Google+ : photo, fonction, et derniers messages postés. On peut donc penser que de nombreux internautes vont enrichir leur profil, pour améliorer leur visibilité...
Cet affichage du Knowledge Graph est sans doute l’une des évolutions les plus importantes de l’interface de Google. Et les internautes semblent l’apprécier, puisque deux semaines après l’intégration de la fonctionnalité sur Google.com, le moteur a annoncé une augmentation notable du nombre de requêtes sur son site... 

Cela étant, nous avons constaté lors de nos tests que la fonction Google Search Plus Your World, dont nous avions parlé dans le n° 96 de Netsources et qui prend en compte le «réseau» de l’utilisateur lorsqu’il interroge Google en étant logué, intervenait également dans les informations du Knowledge Graphe, ou du moins dans les informations qui s’affichent quelquefois dans le pavé à droite des résultats. 

Nous avons ainsi interrogé Google.com avec la requête «Olivier Andrieu» – l’éditeur du site Abondance.com –, en étant logué avec deux profils différents : le premier (écran de gauche) est un compte disposant d’un profil Google+ et ayant Olivier Andrieu dans ses «cercles», le second (écran de droite) est un compte test, sans profil ni contact Google+... 

La comparaison des résultats nous montre que : 
  • le classement des résultats pour cette recherche s’est révélé strictement identique, que l’on soit logué ou non ;
  • le profil Google+ de la personnalité recherchée, accompagné des derniers billets postés, est apparu uniquement lorsque cette personne était dans les cercles de l’utilisateur «logué» ;
  • lorsque les mêmes tests sont effectués avec les mêmes comptes depuis Google.fr, le profil Google+ n’apparaît pas ; le classement des résultats quant à lui est le même sur les deux comptes, mais diffère de celui proposé par Google.com.
On trouvera sur le blog de Recherche éveillée un article qui revient en détail sur l’incidence qu’a le fait d’être logué ou non dans le classement des résultats de Google (http://goo.gl/BDtzV). 

GOOGLE PLAY : LA BIBLIOTHEQUE NUMERIQUE DE GOOGLE ACCESSIBLE EN FRANCE 

Google a lancé en mars 2012 le service Google Play, dans le but d’unifier plusieurs services de téléchargement qui existaient déjà – mais n’étaient pas accessibles depuis la France –, à savoir Google eBooks (lancé en décembre 2010 aux Etats-Unis, voir Netsources n°88), Google Music (novembre 2011) et Google Android Market. 

Ce lancement s’est fait très discrètement en France, car on y trouvait uniquement des applications Android (plus de 600 000) et des films en location. L’accès à ce service se fait depuis l’onglet «Play», proposé dans la barre d’outils en haut de l’écran d’accueil de Google. 

Depuis la mi-juillet, le service s’est enrichi de façon notable avec l’accès à des centaines de milliers de livres en français, issus de maisons d’édition telles que Hachette, Laffon, Plon, Nathan, Gallimard ou encore Eyrolles, et comprenant aussi bien des romans (policiers, science-fiction...) que des essais ou des ouvrages professionnels. 

Google a donc fini par trouver un terrain d’entente avec les éditeurs, qui mettent en vente sur Google Play leur catalogue numérisé – nouveautés comprises –, pour un total d’environ 50 000 ouvrages payants en français. 

On trouve également sur le service les ouvrages étrangers traduits en français, les œuvres tombées dans le domaine public, et des millions d’ouvrages dans toutes les langues. Le catalogue varie cependant d’un pays à l’autre, selon la négociation des droits d’utilisation. 

Les livres téléchargés – qu’ils soient gratuits ou payants – sont stockés dans le «cloud», dans la rubrique «Ma bibliothèque de livres» de Google Play. Cela permet à l’internaute de les consulter depuis un ordinateur (dans son navigateur web), une tablette ou un smartphone (avec l’application Google Play Livres). Il est possible de commencer la lecture depuis son navigateur par exemple, puis de la reprendre ultérieurement depuis sa tablette, en mode offline. 
 
Les prix quant à eux sont théoriquement les mêmes que sur les plateformes des autres vendeurs (Amazon...), puisque Google est soumis au prix unique du livre. Il est en revanche désavantagé en matière de TVA, car celle-ci est fonction du lieu d’implantation de la plateforme. Si les libraires français appliquent une TVA de 7 % pour les livres numériques (qui sera ramenée à 5,5 % en 2013), et que son principal concurrent – Amazon –, localisé au Luxembourg, bénéficie d’une TVA de 3 %, Google doit appliquer la TVA en vigueur en Irlande, qui est de 21 % ! 

En matière de possibilités de recherche, celles-ci sont basiques et bien moins sophistiquées que celles proposées dans le module «Livres» de Google, où l’on peut notamment restreindre la requête aux titres, aux noms d’auteurs, à l’éditeur, ou selon la date de publication. 

On signalera par ailleurs que lors d’une recherche sur Google Livres, la colonne de gauche propose désormais de restreindre la sélection aux «livres électroniques gratuits sur Google» ou à «Google eBooks»... 



Béatrice Foenix-Riou
Publié dans le n° 98 de Netsources (Mai-juin 2012)

Aucun commentaire:

Enregistrer un commentaire