La personnalisation chez Google : une histoire vieille de 14 ans
2004-2011 : Du lancement à l’apogée de la « recherche personnalisée »
La fonctionnalité « recherche personnalisée » a été introduite chez Google dès 2004.
Mais c’est en 2005 qu’elle s’est vue intégrée au moteur de recherche Web et appliquée aux résultats naturels du moteur uniquement pour les internautes disposant d’un compte Google (gmail par exemple) et connectés à leur compte.
Puis en 2009, Google a décidé d’étendre cette fonctionnalité à tous les internautes, qu’ils disposent d’un compte Google ou non.
Grâce aux fameux « cookies », Google est en effet en mesure de collecter une multitude de données personnelles comme la localisation, l’historique de recherche, l’historique de navigation, etc. et est ainsi capable de dresser un portrait de chaque internaute utilisant son moteur.
Et suite au lancement de Google+ en 2011, ce phénomène s’est amplifié avec la collecte des données personnelles sur les internautes qui utilisaient son réseau social. Google s’était même mis à inclure dans ses résultats des pages et sites provenant des ses relations sur Google+.
Toujours à la même époque, Google essayait également de deviner quel était le compte Twitter des internautes et leur posait directement la question dans ses pages de résultats. Et si on avait le malheur de répondre oui, les pages Web twittés par ses contacts remontaient dans les résultats.
2012 -2018 : « La recherche personnalisée », un difficile équilibre à trouver
Mais dès 2012, personnalisation s’est mis à rimer avec mauvaise réputation.
Plusieurs sondages aux Etats-Unis publiés à cette époque sur le sujet ont montré qu’elle était plutôt perçue comme quelque chose de négatif.
Et surtout, il faut bien comprendre que la « recherche personnalisée » se base ni plus ni moins sur la collecte de données personnelles au travers des informations que les internautes fournissent eux-mêmes à Google et aux services Web qu’ils utilisent ou que Google récupère au travers des cookies par exemple.
Or la question de la collecte des données personnelles et du respect de la vie privée est un sujet dont se soucient de plus en plus les internautes.
Depuis cette époque, Google s’était donc fait de plus en plus discret sur la question de la personnalisation de ses résultats. Jusqu’à ces derniers mois...
Au mois de mai dernier, Danny Sullivan, qui est en charge de la communication de Google pour tout ce qui a trait à l’aspect search a répondu à un tweet d’un internaute sur la question de la personnalisation des résultats :
« Pour votre information, la personnalisation des résultats est très légère, la plupart des gens cherchant dans la même langue et au même endroit verront en grande partie la même chose. La localisation et la langue sont la principale raison pour laquelle les résultats diffèrent ». (Dany Sullivan, Twitter, 15 mai 2018)
A les croire, Google ne tiendrait donc pas vraiment compte des autres données qu’il détient sur l’utilisateur (âge, sexe, historique de recherche, historique de navigation, etc.) pour le classement des résultats naturels1.
Plus récemment, en septembre dernier, Google a autorisé les équipes de CNBC à venir assister à l’une de leur réunion sur l’avenir de la recherche et les évolutions de l’algorithme.
On retiendra du compte-rendu proposé par CNBC qu’après beaucoup d’efforts pour tester la personnalisation dans les résultats, Google en a conclu que cela n’améliorait pas vraiment les résultats.
« Une requête entrée par un utilisateur a souvent un tel contexte que la possibilité de personnalisation est très limitée » (Pandu Nayak, head of Google’s search ranking team).
Selon ses dires, la personnalisation opérée par Google aujourd’hui serait essentiellement liée à la localisation de l’internaute et le contexte immédiat de la recherche précédente.
Aux critères cités par Dany Sullivan au mois de mai dernier s’ajouterait donc le contexte immédiat de la recherche précédente.
En principe donc, si on entre une première requête « comparatif opérateurs téléphoniques
» puis une deuxième « Orange
», Google devrait nous proposer des résultats en lien avec l’opérateur téléphonique et non la couleur ni le fruit.
Mais à peine quelques jours après ces déclarations, lors d’un événement pour célébrer ses 20 ans, Google a annoncé le lancement prochain d’une nouvelle fonctionnalité appelée « Activity Cards » qui s’affichera dans les résultats de son moteur Web.
Et cette nouvelle fonctionnalité fait la part belle à la personnalisation des résultats en lien avec l’historique de recherche...
Si Google a annoncé déployer cette fonctionnalité sur mobile d’ici la fin de l’année, impossible de savoir en revanche si cela sera également déployé sur desktop. Rien n’est moins sûr d’ailleurs car la politique actuelle de Google est résolument tournée vers le mobile.
Quand l’utilisateur entrera une requête similaire ou liée à une requête qu’il a déjà faite par le passé, Google affichera donc une « carte d’activité », matérialisée sous la forme d’un encadré au dessus de la liste des résultats naturels. Cette carte inclura des pages jugées pertinentes qu’il a déjà visitées par le passé et affichera les requêtes qu’il avait entrées à l’époque et qui avaient permis d’afficher ses pages.
Cette « carte » ne sera affichée que quand Google déterminera que cela peut avoir un intérêt pour l’utilisateur et la recherche.
On n’est donc plus seulement dans le contexte immédiat de la recherche précédente mais bien dans la personnalisation des résultats liés à l’historique de recherche sur plusieurs mois, voire même, des années...
Mais contrairement à ce qui existait déjà, cette personnalisation n’est pas mélangée aux autres résultats et l’internaute a en principe conscience que ce qu’il voit est personnalisé.
Et à l’heure où nous bouclons ce numéro, Google vient d’annoncer qu’il serait désormais plus facile pour les internautes de gérer leurs données personnelles et supprimer leur historique de recherche. Pour ce faire, il vient d’ajouter sur la page d’accueil du moteur un bouton « Gardez le contrôle sur vos informations de recherche Google » avec différentes options. Ce n’est pas complètement nouveau, juste plus visible.
Enfin, la personnalisation des résultats liée à sa présence et contacts sur les médias sociaux semble quant à elle en voie de disparition. Google ne semble déjà plus tenir compte de la présence des internautes sur Twitter, Facebook, etc pour le classement des résultats. D’autre part, le géant américain vient d’annoncer la fermeture de Google+ en ce début octobre, ce qui peut laisser supposer que toute personnalisation liée à Google+ devrait prochainement disparaître...
Au regard de toutes ces actions et déclarations presque contradictoires, on a l’impression que, chez Google, il y a une forme de schizophrénie ou du moins une lutte interne avec d’un côté ceux qui croient dur comme fer aux bienfaits de la personnalisation que ce soit dans les produits Google, les résultats sponsorisés mais aussi pour les résultats naturels et de l’autre, ceux qui pensent que cela n’apporte en fait pas grand chose aux résultats naturels sur le moteur Web.
L’article de CNBC le montre d’ailleurs bien lorsqu’il rapporte les propos de Pandu Nayak :
« Certains employés soutiennent depuis longtemps que les résultats de recherche devraient être encore plus personnalisés. Mais aujourd’hui, il y a très peu de personnalisation au niveau de la recherche ».
Face à un discours ambiant de plus en plus anti-personnalisation et des internautes de plus en plus soucieux du respect de leur vie privée, difficile pour Google de tenir un discours 100% pro-personnalisation.
Et avec cette nouvelle fonctionnalité (Activity Cards), on a le sentiment que Google n’a pas du tout l’intention de renoncer à la personnalisation des résultats mais cherche encore le bon moyen d’intégrer la personnalisation à ses résultats naturels tout en essayant de répondre aux préoccupations des internautes ou du moins tout en évitant un maximum de critiques.
La personnalisation est et reste au coeur du business model de Google et sa stratégie à long-terme de devenir un moteur de réponses et un assistant personnel plus qu’un moteur de recherche ne plaide pas pour un retrait de la personnalisation des résultats.
Mais la personnalisation des résultats naturels est-elle aujourd’hui aussi « light » que Google veut bien nous le faire croire ? Car d’autres voix s’élèvent et ne vont pas vraiment dans le sens d’une disparition progressive de la personnalisation. Et si cette personnalisation est plus importante qu’annoncée, quel impact sur la recherche d’information professionnelle ? Nous avons enquêté et avons également décidé de mener nos propres tests.
Des études et avis d’experts contradictoires
Un sujet très étudié entre 2011 et 2013
La question de la personnalisation sur Google a été très étudiée mais surtout à l’époque où Google en parlait beaucoup. On retrouve donc de nombreux articles et contributions datant de 2011-2013.
Si tout le monde s’accorde sur le fait qu’il y a une forme de personnalisation chez Google et autres moteurs de recherche comme Bing par exemple, l’évaluation de son ampleur varie grandement d’un expert et d’une étude à l’autre.
Eli Pariser et les « bulles de filtres »
On ne peut parler personnalisation sans évoquer Eli Pariser et son désormais célèbre ouvrage « The Filter Bubble: What the Internet is Hiding From You » paru en 2011. A cette époque, on rappellera que Google communiquait encore sur les bienfaits de la « recherche personnalisée ».
Dans son ouvrage, Eli Pariser développait le concept des « bulles de filtres » selon lequel les réseaux sociaux et les grands moteurs comme Facebook, Google ou encore Microsoft tirent parti des données qu’ils collectent sur les utilisateurs et leur proposent des interfaces, des flux d’informations et des résultats personnalisés.
Chaque internaute accèderait donc à une version différente du Web et se retrouverait dans une bulle où il ne verrait que les contenus en provenance de ses amis et contacts et des sources qu’il a choisi de suivre mais également des contenus que des algorithmes ont choisis pour lui à partir des données qu’ils détiennent sur lui.
Mais déjà à l’époque, certains remettaient en cause cette théorie et surtout le pouvoir donné aux algorithmes.
Une expérience toute autre pour le rédacteur en chef de Slate
Jacob Weisberg, président et rédacteur en chef de Slate Group avait à l’époque rédigé un article indiquant que son expérience de la personnalisation sur Google était toute autre.
Il avait alors demandé à quelques abonnés Twitter et contacts Facebook aux profils très différents d’effectuer 4 requêtes susceptibles de faire l’objet d’une fragmentation idéologique. Et même s’il y avait bien quelques différences sur la première page de résultats, elles étaient minimes.
Il avait ensuite contacté Google sur la question de la personnalisation qui lui avait alors répondu :
« En réalité nous avons des algorithmes spécifiquement conçus pour limiter la personnalisation et promouvoir la variété dans les pages de résultats ».
Un autre expert qu’il avait contacté, Jonathan Zittrain, professeur de droit et d’informatique à Harvard, qui étudie la censure du Web allait également dans cette direction et lui avait indiqué :
« Mon expérience me laisse croire que les effets de la personnalisation des recherches sont légers. »
Une personnalisation massive pour DuckDuckGo
A l’inverse, on pourra citer une étude réalisée en 2012 par le moteur DuckDuckGo, qui, rappelons le, se positionne sur le créneau des moteurs qui respectent la vie privée des utilisateurs.
Dans cette étude, 131 personnes avaient réalisé des requêtes identiques sur des sujets idéologiques en utilisant des mots-clés tels que abortion, gun control, etc.
Les résultats pointaient le recours à une personnalisation massive avec des résultats parfois complètement différents d’un internaute à l’autre.
Mais DuckDuckGo étant un concurrent direct de Google, cette étude est-elle vraiment objective ?
Une étude de référence parue en 2013 : « Measuring Personalization of Web search » et des résultats plus mesurés
L’étude qui nous a semblé la plus intéressante date de 2013 et a été présentée lors de la 22e conférence internationale sur le World Wide Web qui avait eu lieu à Rio de Janeiro.
Et ici, les auteurs sont des chercheurs de la Northeastern University à Boston, ce qui, on peut l’espérer, limite les risques de conflits d’intérêts.
L’article de 29 pages est librement accessible à l’adresse suivante : Measuring Personalization of Web Search.
Pour cette étude, les chercheurs ont ainsi demandé à 200 utilisateurs réguliers et disposant de comptes actifs sur Google et 100 sur Bing de réaliser des tests sur ces deux moteurs. Pour plus de détails sur la méthodologie utilisée, nous vous conseillons la lecture de l’article dans son intégralité.
Et les résultats sont tout à fait intéressants.
Les auteurs estiment qu’en moyenne, 11.7 % des résultats sur Google diffèrent en raison de la personnalisation et 15.8 % sur Bing.
Mais il y a de grosses différences selon le type de requête et selon la place des résultats :
- Les requêtes liées à des questions politiques, à l’actualité ou des questions locales tels des achats en ligne ou des informations liées à des entreprises locales sont plus à même d’être personnalisées que les autres
- et les résultats en haut de page sont très souvent les mêmes tandis que ceux en bas de page ont plus tendance à varier d’un internaute à l’autre.
Les auteurs précisent d’ailleurs que les requêtes les moins assujetties à la personnalisation sont les requêtes et questions factuelles (du type « qu’est-ce que... ») ou liées à la santé.
Les auteurs ont également tenté de déterminer quels critères entraient en compte dans la personnalisation des résultats sur Google et Bing. Et voici leur constat :
- le fait d’être connecté ou non à son compte Google ou Microsoft ou le fait d’effacer ses cookies peut modifier les résultats mais cela reste limité ;
- la localisation de l’internaute impacte bien les résultats ;
- l’utilisation de navigateurs différents n’impacte pas les résultats ;
- les données démographiques de l’internaute (femme, homme, âge, etc.) n’impactent pas les résultats ;
- l’historique de recherche et de navigation n’impacte pas non plus les résultats. Seul l’historique immédiat (la recherche ou les quelques recherches précédentes) peut les impacter. Les auteurs s’avouent même les premiers surpris par ces résultats.
Et aujourd’hui ?
Ces dernières années, le discours public de Google a changé. La personnalisation est-elle toujours la même que celle évaluée dans l’article de 2013 ?
On constate que depuis cette date, il n’y a presque plus d’articles et d’études sur le sujet. On trouve bien des choses sur les autres services de Google tels que Google Actualités ou encore YouTube mais pratiquement rien sur le moteur Web.
Une affaire de catégorisation plutôt qu’une personnalisation ?
On citera néanmoins un article paru sur Internet Actu en 2017 intitulé « Comment nous passer de la personnalisation ? ».
L’auteur, Hubert Guillaud, y indiquait qu’en réalité les grands acteurs du Web ne cherchent pas à proposer de l’information personnalisée à chaque internaute mais plutôt à les catégoriser, à les faire rentrer dans une case précise (femme de 30-35 ans avec enfants par exemple).
Pour autant, aussi intéressant soit-il, cet article n’évalue pas l’ampleur de la personnalisation chez Google et les critères de Google pour appliquer cette personnalisation.
Quelle personnalisation aujourd’hui ?: quelques questions à Olivier Andrieu, expert SEO2 et auteur du blog Abondance
Nous sommes donc allés poser quelques questions à Olivier Andrieu, expert reconnu du SEO en France et auteur de l’incontournable blog Abondance dédié au SEO.
Google déclare aujourd’hui que la personnalisation de ses résultats est très légère: Que pensez-vous de ces déclarations ?
Olivier Andrieu :« Je n’ai pas vu beaucoup de changements dernièrement à ce niveau sur Google. La personnalisation (adresse IP, langue du navigateur) et la contextualisation (historique des recherches, profil du chercheur) me semblent toujours en place, comme avant.
C’est même assez facilement démontrable : les résultats Google+ s’affichent quand on est connecté3, et mon site est plus souvent présent dans les SERP4 lorsque je suis connecté sur mon compte Google. »
Suite aux différents scandales et polémiques des dernières années comme « les bulles de filtres », Cambridge Analytica, le respect de la vie privée, la mise en place du RGPD en Europe, pensez-vous que Google a du revoir sa copie en matière de personnalisation des résultats ?
Olivier Andrieu :« Google la revoie tout le temps, je pense, en fonction des lois qui se mettent en place au fil du temps. C’est normal. On peut d’ailleurs y rajouter le droit à l’oubli, qui lui a fait changer pas mal de choses dans son organisation et sur son moteur. Google n’est pas au-dessus des lois (en tout cas, c’est préférable...). »
Nos tests
Contexte
Nous avons ensuite choisi de mener nos propres tests pour évaluer l’ampleur de la personnalisation des résultats chez Google dans un contexte de recherche d’information professionnelle.
Pour cela, nous avons demandé à 20 personnes avec des profils très différents de réaliser 5 recherches sur Google en saisissant exactement les mêmes requêtes.
Nous leur avons demandé de faire les tests sur ordinateur uniquement car, même si Google déploie son index Mobile first sur tous les supports, il est loin d’avoir terminé et il peut encore exister des différences entre l’index mobile et desktop, ce qui n’a rien à voir avec une quelconque personnalisation.
On précisera également que les tests se sont étalés sur une période de 2 semaines.
Parmi ces 20 personnes, un groupe de 4 personnes a effectué les tests au même endroit au même moment mais sur des ordinateurs différents.
Parmi ces 20 personnes, il y avait :
- des professionnels de l’information mais également des personnes complètement extérieures au domaine (ingénieurs, retraités, informaticiens, juristes, architectes, etc.) ;
- des Français ou francophones mais également des anglophones qui n’ont jamais recherché d’information en français ;
- des personnes en France mais également au Royaume-Uni, aux Etats-Unis, en Suisse et au Japon ;
- des personnes qui utilisent Google quotidiennement et d’autres qui ont abandonné son utilisation depuis déjà quelques temps ;
- des gens qui disposent de comptes Google et d’autres qui n’en ont jamais eu ;
- des gens qui effacent systématiquement leur historique et les cookies et d’autres qui ne le font jamais,
- etc.
Nous avons choisi 5 requêtes différentes sur des sujets que nous connaissons ou que nous avons déjà eu l’occasion de traiter. Cela nous permettait une meilleure compréhension des résultats et de leur pertinence.
Requête 1 : Recherche d’informations générales et d’actualités sur une entreprise
Qwant
On parle beaucoup du moteur en ce moment et une recherche permettra de faire remonter des résultats d’actualités sur la société. Or, d’après l’étude de 2013 citée précédemment sur le fonctionnement de Google, les requêtes liées à l’actualité font parties des plus personnalisées.
D’autre part, la recherche sur le nom d’une entreprise ou personnalité est intéressante car le moteur ne peut savoir à partir de la seule requête si l’internaute est intéressé par des résultats en français, anglais ou toute autre langue. Et dans ce cas précis, Google va très probablement personnaliser les résultats en fonction de la localisation de l’internaute et de la langue de l’interface.
Requête 2 : Recherche de données brutes
liste gares de fret france
Requête 3 : Recherche d’une liste d’outils
free social media monitoring tools
Requête 4 : recherche d’études de marché et de statistiques
indonesia automotive industry outlook 2018
Requête 5 : recherche d’articles/billets méthodologiques
retrouver vieux articles presse
Pour cette requête, nous avions publié un billet de blog répondant à cette question il y a quelques années. Quand nous lançons la recherche, notre article arrive systématiquement en première position. Mais est-ce uniquement parce qu’il s’agit de notre site et parce que nous nous y rendons très souvent ou bien est-ce le cas pour tout le monde ?
Nous avons ensuite demandé à chaque participant de répondre à quelques questions pour mieux comprendre dans quel contexte ils avaient fait la recherche et ce qui pouvait éventuellement influer sur la liste de résultats comme la date des tests, la ville, la langue de l’interface Google, s’ils étaient connectés à un compte Google, les services Google qu’ils avaient l’habitude d’utiliser, les sites qu’ils avaient déjà consultés, s’ils effaçaient leur historique et leurs cookies, etc.
Analyse des résultats : 20 participants et des variations surtout liées à la langue de l’interface
Requête 1 : Qwant
Comme on pouvait s’en douter, c’est pour cette requête que nous avons pu constater le plus de variations dans les résultats. Car il s’agit à la fois d’une requête liée à l’actualité et que la requête en elle-même ne permet pas de déterminer la langue des résultats souhaitée.
Globalement, on constate que c’est surtout la langue de l’interface qui joue le plus grand rôle, suivie de la localisation de l’internaute.
- Toutes les personnes basées en France avec une interface Google en français avaient des résultats similaires. L’ordre des résultats pouvait varier mais au final on retrouvait toujours pratiquement la même chose. Les résultats étaient tous en français.
- Les quelques actualités qui ressortaient sur la première page pouvaient être différentes mais, comme les tests n’ont pas tous été effectués exactement au même moment mais étalés sur une période de deux semaines, cela n’est pas nécessairement lié à la personnalisation mais uniquement au fait que plusieurs nouveaux articles sur Qwant paraissaient tous les jours.
- Seules les personnes basées à Paris intra-muros voyaient apparaître une carte avec la localisation des bureaux de Qwant à Paris mais pas tous.
- Les personnes basées dans des pays anglophones et utilisant l’interface en anglais avaient des résultats très similaires entre eux et tous en anglais. Mais différents des personnes en France utilisant l’interface en français. Aucune de ces personnes n’avait de module Actualités ou Vidéos qui apparaissaient en haut des résultats ni de carte.
- Pour les personnes dans des pays anglophones mais utilisant une interface en français, les résultats étaient très similaires à ceux des personnes basées en France avec une interface en français. Un seul résultat en anglais venait se glisser dans la page de résultats.
- Inversement, pour les personnes utilisant l’interface en anglais mais dans des pays francophones, les résultats étaient très similaires à ceux des personnes basées dans des pays anglophones avec une interface en anglais. Un seul résultat en français venait se glisser dans la première page de résultats.
A retenir
Pour cette requête, on pouvait constater que la langue de l’interface avait un poids très important. La localisation jouait aussi un rôle mais les différences n’étaient pas massives. Et en ce qui concerne l’ordre des résultats qui pouvait varier légèrement d’un internaute à l’autre, rien ne nous a permis de déterminer s’il y avait une quelconque personnalisation là-dedans.
Requête 2 : Liste gares de fret france
Pour cette requête, la première page de résultats était quasiment identique pour tous les participants et tous les résultats affichés l’étaient en français.
Le haut de la page de résultats était la même pour tous le monde et le résultat issu de data.gouv.fr qui fournissait la réponse la plus pertinente sur la question était en première position pour tous les participants. On pouvait seulement noter quelques variations dans les 2 ou 3 derniers résultats de la page.
On pouvait constater que la majorité des personnes utilisant l’interface en français avaient des résultats issus de sites de presse dans leurs derniers résultats (1 ou 2 selon les personnes). Il s’agissait d’articles de presse anciens datant de plusieurs années mais les sites variaient selon les participants : NouvelObs pour certains, La Croix pour d’autres ou encore l’Humanité ou France 3. La présence de sites plutôt que d’autres ne semble cependant pas avoir de lien avec les convictions politiques ou religieuses des participants.
Les personnes avec une interface en anglais n’avaient en revanche aucun site d’actualité sur leur page de résultats mais plus de pages issues de Wikipédia.
Un élément surprenant
Lorsque nous avons reçu les premières retours des participants basés à Paris, nous avons pu constater que certains avaient en fin de première page un résultat appelé « carte du trafic fret » provenant du site suivant : latitude-cartagene.com.
Or nous n’avions pas ce résultat sur notre première page ni dans les suivantes d’ailleurs (cette recherche ne générait même pas 100 résultats). Pour information, nous avions réalisé la recherche depuis le Royaume-uni mais avec une interface en français.
Il s’agit du site d’une entreprise spécialisée en cartographie basée à Lyon.
Nous avons donc relancé une recherche liste gares de fret france latitude cartagene
.
Là, le résultat est ressorti en première position.
Nous avons relancé la requête initiale liste gare de fret france
. Et là, le résultat apparaissait bien sur la première page avec juste en dessous un petit commentaire nous indiquant « vous avez consulté cette page le 29/09/2018 ».
Depuis ce jour, à chaque fois que nous relançons la requête liste gares de fret france
, nous avons toujours bien ce résultat qui s’affiche en bas de page avec la mention « vous avez consulté cette page le ... ». Puis cette mention a finalement disparu au bout de plusieurs semaines.
A retenir
Pour le cas de cette requête, les participants accédaient sensiblement au même résultat mais on avait le sentiment d’avoir affaire à une légère forme de personnalisation liée à l’historique de recherche immédiat mais aussi plus ancien.
Requête 3 : Free social media monitoring tools
Là encore, peu de différences entre les participants. Tout le monde obtenait des résultats en anglais.
Le featured snippet pouvait varier d’une personne à l’autre. Pour la majorité des personnes, la source était business2community.com ou oursocialtimes.com. Une personne a eu un featured snippet issu de Brandwatch sans qu’elle ne connaisse ni l’entreprise ni leur produit et sans avoir jamais visité leur site Web par le passé.
Les résultats étaient les mêmes mais l’ordre des résultats pouvaient varier d’une personne à l’autre et les deux derniers résultats de la page étaient différents pour certains participants.
A retenir
Pour cette requête, il n’y avait donc pas ou très peu de personnalisation.
Requête 4 : Indonesia automotive industry outlook 2018
Encore une fois des résultats quasi-identiques même si l’ordre pouvaient varier d’une personne à l’autre.
Le seul élément marquant : toutes les personnes utilisant une interface en anglais en dehors de France avaient un résultat issu de l’agence de presse américaine PR Newswire dans les premiers résultats alors que les personnes utilisant l’interface en français ne l’avait jamais sur la première page.
A retenir
L’apparition de sites de presse et d’actualités dans la première page de résultats semble donc liée à la langue de l’interface utilisée.
Requête 5 : Retrouver vieux articles presse
Tous les participants avaient le même premier résultat. Le reste des résultats était pratiquement identique mais l’ordre variait d’une personne à l’autre.
On constatera que nous n’étions que deux (mais tous deux travaillant pour la même entreprise) à avoir un résultat issu du site echosdoc.net, un site belge bien connu des professionnels de l’information que nous consultons régulièrement et avec lequel nous avons même un partenariat.
Autre remarque, la personne ayant réalisé les tests en Suisse à Genève avait sur sa première page un résultat issu d’un site suisse bcu.lausanne.ch, la bibliothèque universitaire de Lausanne (Archives de la presse romande). Aucun autre participant n’avait ce résultat sur sa première page.
A retenir
La personnalisation est encore une fois légère mais il y a tout de même quelques variations liées à la localisation et l’historique de recherche.
Au même endroit au même moment
Parmi les participants, nous avons demandé à 4 personnes (une partie de l’équipe de notre société-soeur FLA Consultants) de réaliser les mêmes tests au même endroit au même moment mais sur des ordinateurs différents.
De cette manière, on évite les biais liés aux différences dans le temps et à la localisation.
Trois des personnes utilisaient l’interface de Google en français, la quatrième l’interface en anglais.
Et on arrive sensiblement aux mêmes conclusions que les précédents tests :
- Les personnes utilisant l’interface en français avaient des résultats presque identiques et dans le même ordre ;
- la langue de l’interface faisait varier les résultats principalement pour la première requête ; Pour les autres requêtes, les résultats étaient très similaires.
- la présence de sites d’actualités sur la première page semble bien conditionnée par la langue de l’interface. La personne utilisant l’interface en anglais n’avait jamais de résultats issus de sites de presse français ou francophones même quand la requête était pourtant en français ;
- on peut noter une légère forme de personnalisation liée à l’historique de recherche. La personne qui recherche et consulte le plus de vidéos avait parfois un module vidéos que les autres n’avaient pas ;
- dans la majorité des cas, lorsqu’un résultat apparaît chez les uns et pas chez les autres, il y a rarement d’explication évidente (historique de recherche, données démographiques, etc.) car il s’agit de sites qu’ils ne connaissent pas et qu’ils n’ont jamais visités.
Sur ce même sujet, nous avons eu l’occasion d’assister mi-octobre à un workshop à Londres intitulé « Search Academy 2018 » animé par Marydee Ojala, rédactrice en chef du magazine américain Online Searcher dans le cadre du salon Internet Librarian International.
Et nous avons pu constater à cette occasion, que la recherche personnalisée sur Google et son impact sur les professionnels de l’information était également un sujet d’actualité et d’intérêt pour les pro de l’info anglo-saxons.Lors de ce workshop, il a été demandé aux participants de réaliser en même temps une requête sur Google sur le terme Brexit
. Et force est de constater que la première page de résultats variait beaucoup d’une personne à l’autre.
Mais les supports utilisés étaient différents (ordinateur portable, téléphone ou tablette) et surtout, les participants qui venaient des quatre coins du monde utilisaient pour beaucoup l’interface Google dans la langue locale de leur pays d’origine.
Quelles différences en changeant la langue, en supprimant l’historique, etc ?
Nous avons ensuite voulu tester quelles pouvaient être les différences de résultats pour une même personne selon qu’elle change la langue de l’interface, qu’elle efface l’historique et les cookies, etc.
Nous avons donc sur un même ordinateur et à quelques minutes d’intervalle effectué les requêtes :
- sur l’interface Google en français depuis Firefox en étant connecté à un compte Google et sans avoir effacé l’historique ou les cookies depuis des mois ;
- puis dans l’interface en anglais avec les mêmes paramètres ;
- puis dans Chrome en étant connecté à un autre compte Google ;
- puis en retournant sur Firefox et en se déconnectant du compte Google ;
- puis en effaçant l’historique Google ;
- puis en effaçant les cookies et l’historique du navigateur ;
- puis en utilisant la navigation privée de Google ;
- puis en changeant le paramètre de région dans Google ;
- puis en ajoutant
&pws=0
à la fin de l’url censée « dépersonnaliser » la recherche.
A retenir
Force est de constater que les différences étaient faibles.
Nous avons également regardé s’il y avait une différence de nombre de résultats visualisables selon que l’on soit connecté ou non, que l’on ait effacé l’historique ou non, etc. Et pour aucune des 5 requêtes, nous n’avons noté de différences au niveau du nombre de résultats.
La seule requête qui générait de grosses différences était la première (Qwant) selon que l’on choisissait l’interface en langue anglaise ou française.
Le fait de se déconnecter de son compte Google faisait très légèrement varier les résultats pour toutes les requêtes : quelques pages Wikipédia en plus et quelques résultats inversés seulement.
Et pour la dernière requête, le résultat issu du site Echosdoc n’apparaissait plus lorsque l’on supprimait l’historique et les cookies.
La recherche personnalisée, oui, mais limitée
Au final, nos tests vont dans la direction des conclusions de l’article de recherche publié en 2013.
Il existerait donc toujours une forme de personnalisation sur Google et elle n’aurait en réalité pas beaucoup changé depuis ces 5 ou 10 dernières années.
- La personnalisation varie selon le type de requêtes. Les requêtes liées à l’actualité ou à des questions locales semblent beaucoup plus impactées par la personnalisation. La recherche d’ informations factuelles telles que des statistiques, données historiques, informations sur une personne, une entreprise, etc est quant à elle peu impactée ;
- la langue de l’interface semble avoir le plus de poids sur la variation des résultats suivie par la localisation de l’internaute ;
- l’historique de recherche récent et même plus ancien semble aussi jouer un rôle de temps à autre mais cela reste très difficile à évaluer et très aléatoire ;
- en revanche, nous n’avons pas perçu de différences liées au profil de l’utilisateur (sexe, âge, conviction politiques et religieuses, etc.) ;
- nous n’avons pas non plus perçu une quelconque personnalisation liée à la présence sur les médias sociaux et ses contacts ; Cet aspect semble en voie de disparition et la disparition annoncée de Google+ devrait y mettre complètement fin ;
- le fait de se déconnecter d’un compte peut jouer un rôle mais mineur ;
- idem pour l’historique et les cookies ;
D’autre part, il faut également être conscient que les résultats peuvent varier d’un internaute à l’autre et même pour un même internaute pour d’autres raisons :
- en fonction du data center sur lequel la requête a été lancée. Tous les data centers ne sont pas toujours parfaitement synchronisés ;
- les mises à jour en continu de l’index peuvent faire varier les résultats ;
- les tests que Google pratiquent régulièrement sur un panel d’internautes sans qu’ils en soient prévenus.
Quel impact pour le professionnel de l’information ?
La recherche personnalisée est donc souvent légère mais il ne faut pas pour autant en conclure qu’elle ne représente pas un problème pour les professionnels de l’information.
Tout dépend de la question et du sujet traité.
S’il s’agit d’une question nécessitant une réponse unique ou simple, il tient fort à parier qu’on trouvera ce que l’on cherche dans les premiers résultats, qu’ils soient personnalisés ou non.
En revanche, toute question liée à l’actualité et toute recherche d’information à l’international ou impliquant une dimension locale nécessite qu’on s’interroge en amont. Il convient de faire de même lorsque l’on veut faire le tour d’un sujet ou avoir une vision panoramique d’une thématique
La liste de résultats personnalisés n’est pas nécessairement meilleure ou moins bonne qu’une liste de résultats non personnalisés mais elle est différente.
Et quand on sait que Google affiche de moins en en moins de résultats pour chaque requête - on pouvait facilement obtenir 800 / 1000 résultats visualisables il y a encore 5 ans alors qu’aujourd’hui on tourne plutôt autour des 200 résultats visualisables, on peut vite passer à côté de quelques résultats et sources intéressantes.
Probablement pas la majorité mais quelques-uns tout de même !
Nos conseils pour une recherche optimale
On conseillera donc de commencer par une recherche classique qui génèrera peut-être plus ou moins de résultats personnalisés. Mais ces résultats pourront être intéressants en soi.
Et parallèlement ou dans un second temps, on tentera d’effectuer une recherche la plus « neutre » possible.
Pour Olivier Andrieu, expert SEO et auteur du blog Abondance, il existe plusieurs méthodes pour y parvenir :
« La navigation privée, le passage par un VPN ou un proxy, le fait de refuser systématiquement les cookies et de ne pas se connecter à son compte Google.
Pour ma part, si je veux faire une recherche neutre, j’utilise un navigateur spécifique qui ne me sert qu’à ça, et qui n’est pas connecté sur mon compte et refuse les cookies (d’où le fait que j’utilise un navigateur dédié, car quand on refuse les cookies, il n’est pas simple d’utiliser certains sites). »
Enfin, pour toutes questions liées à l’international ou des problématiques locales, on aura grandement intérêt à utiliser la langue locale dans l’interface Google.
Utiliser la version locale de Google est également utile mais Google ne le permet plus depuis quelques temps.
Auparavant, si vous alliez sur google.co.uk, vous interrogiez bien le Google britannique. Mais désormais, seule la localisation réelle de l’internaute est prise en compte. Pour interroger une autre version de Google, il faudra soit changer les paramètres de région et de langue dans les paramètres Google (mais il n’est pas certain qu’on accède vraiment à la même chose que les gens réellement basés dans le pays choisi) soit utiliser un VPN.
On pourra également recourir à un petit outil très utile : isearchfrom.com.
I search from permet de simuler des requêtes sur les différentes interfaces locales de Google.
Il suffit d’entrer sa requête, choisir le pays, la langue, le support (ordinateur, téléphone, etc.) et de sélectionner ou non quelques critères supplémentaires (ville, connecté à un compte Google, etc.).
Enfin, pourquoi ne pas interroger un autre moteur comme Bing par exemple qui ne dispose pas du même index ni du même classement des résultats ? On pourrait également recourir à des moteurs qui ne pratiquent de recherche personnalisée comme DuckDuckGo ou Qwant dont nous parlons par la suite ?
Mais si Qwant peut éventuellement faire l’affaire dans la vie de tous les jours et pour des questions simples, est-il à la hauteur et peut-il répondre aux problématiques parfois complexes des professionnels de l’information ?
- 1 On précisera bien ici que nous nous intéressons uniquement à l’effet de la personnalisation sur les résultats naturels du moteur Web et non les résultats sponsorisés qui apparaissent au haut et en bas de la liste des résultats et qui sont des publicités hautement ciblées et personnalisées. Il existe également d’autres formes de personnalisation sur les autres produits et services Google comme Google Actualités ou YouTube que nous n’aborderons pas ici.
- 2 Search Engine Optimization
- 3 Cette interview a eu lieu avant l’annonce de la fermeture de Google+
- 4 Abbréviation désignant la page de résultats des moteurs de recherche.