En amont, segmenter son sujet en questions simples
Comme nous avons pu le voir, Google admet lui-même avoir encore du mal avec les questions complexes qui nécessitent des réponses structurées, nuancées et qui requièrent d’associer différentes informations.
Ainsi, si vous effectuez par exemple une recherche sur le marché des animaux de compagnie en France, réfléchissez bien en amont à tous les angles de la recherche et à toutes les questions pour lesquelles vous souhaitez avoir des réponses.
Exemple :
La requête la plus évidente :
marché des animaux de compagnie en France
fournira des résultats tout à fait pertinents tels que :
- « Le marché des animaux de compagnie : les chiffres clés, état des lieux »
- « Animaux de compagnie : un marché de 5 milliards d’euros en France l’an dernier »
- « Yoann Latouche décrypte le marché des animaux de compagnie : tendances 2021 et futures »
- « Le business des animaux : un marché en pleine expansion ! »
Si vous voulez seulement avoir quelques chiffres et éléments clés à intégrer à une présentation, cela pourra sûrement suffire, mais si le but est de réaliser une étude beaucoup plus complète, Google ne vous aura proposé ici qu’une petite partie de ce qui peut être utile.
Google est un assistant qui ne sait pour l’instant pas faire plusieurs choses à la fois (mais l’algorithme MUM devrait le lui permettre). Il faut donc lui poser des questions simples, les unes après les autres. Et ne pas mélanger plusieurs langues en même temps.
Il est donc crucial de réfléchir en amont à tous les angles du sujet et de transformer chaque angle sous la forme d’une requête en langage naturel.
Exemple :
Dans le cas de notre sujet sur le marché des animaux de compagnie, les différents angles pourraient être les suivants :
- Nombre d’animaux de compagnie par type d’animaux (chien, chat, lapin, etc.) et leur évolution au cours des 5/10 dernières années ;
- Impact de la pandémie de coronavirus sur ce marché ;
- Informations sur les dépenses et l’évolution des dépenses des Français pour leurs animaux de compagnie ;
- Informations sur le marché de la nourriture pour animaux ;
- Innovations (lancement de nouveaux services ou produits originaux ou innovants) ;
- Prévisions à long terme, etc.
Chacun de ces angles pourra être transformé en question/requête plus ou moins précise et en langage naturel.
Par exemple, si l’on souhaite consacrer une partie de cette étude au lapin comme animal de compagnie en France et l’évolution de l’intérêt des Français pour cet animal de compagnie, on se rend vite compte que les résultats fournis par Google pour notre requête marché des animaux de compagnie en France ne sont pas assez précis et détaillés et ne nous donnent aucun élément de réponse sur cet aspect. Il va donc falloir aller rechercher spécifiquement sur cette question-là.
Pourquoi faut-il éviter de communiquer avec Google en booléen ?
En tant que professionnel de l’information, on peut être tenté d’entrer des requêtes booléennes comme on le faisait par le passé et comme on le fait toujours dans certaines bases de données.
On pourrait ainsi être tenté d’écrire par exemple :
Evolution OR nombre OR pourcentage OR marché chiens OR chats OR lapins France
Pour cette requête, les résultats ne sont pas mauvais en soi, mais sont tout de même un peu moins bons que lorsqu’on recherche en langage naturel.
Il y a d’ailleurs plus de résultats anciens et donc un peu trop datés pour répondre à notre question. Et il y a aussi de nombreux cas où une recherche booléenne fournit des résultats qui n’ont ni queue ni tête.
La recherche booléenne a un sens quand on cherche à repérer tous les documents qui contiennent une combinaison de mots-clés. Sauf que ce n’est plus du tout ce que fait Google. Google ne cherche pas des pages qui contiennent les mots-clés, mais cherche avant tout à comprendre l’intention de l’internaute.
Et quand on lui parle en booléen, il ne comprend bien souvent pas du tout où nous voulons en venir. Et cela le rend plutôt mauvais… Il n’élargit plus la recherche aux concepts proches et synonymes, il part un peu dans tous les sens. Bref, il n’arrive plus à faire ce pour quoi il a été conçu.
C’est pour cela qu’il est aujourd’hui préférable d’interroger Google en langage naturel avec des questions simples.
Vérifier que Google a bien compris la question
Comme nous avons pu le voir dans l’article « Google n’est plus un moteur de recherche ni de réponses, mais un assistant virtuel », l’intention de l’utilisateur est clé dans le fonctionnement de Google aujourd’hui.
Dès qu’on entre une requête dans Google, Google interprète notre question et il faut donc s’assurer qu’il part dans la bonne direction.
Si l’on reprend notre exemple sur les lapins, et qu’on entre la requête suivante :
évolution lapins en France
Google ne nous fournit que des résultats sur l’évolution de la production de lapins en France destinés à être mangés (Cf. Figure 1. Requête évolution lapins en France). Il n’a visiblement pas compris notre question et notre besoin et, ce, même si deux minutes avant nous avions effectué une recherche sur les animaux de compagnie en France.
Figure 1. Requête évolution lapins en France
Google est un assistant à qui il faut réexpliquer le contexte à chaque question.
Si on relance la recherche en entrant cette fois-ci
évolution lapins de compagnie en France
Cette fois-ci Google nous propose bien des résultats pertinents (Cf. Figure 2. Requête évolution lapins de compagnie en France). On constate d’ailleurs qu’il nous propose automatiquement des résultats utilisant le terme « lapin domestique » qui semble en réalité beaucoup plus usité que celui de « lapin de compagnie ».
Figure 2. Requête évolution lapins de compagnie en France
Quand les premiers résultats d’une recherche sur Google sont hors-sujet, cela ne sert à rien d’aller plus loin. Il faut reformuler la requête.
On pourra éventuellement s’inspirer des recherches associées proposées par Google, qui peuvent parfois nous mettre sur la bonne piste.
Zoomer et dézoomer jusqu’à obtenir les résultats souhaités
Rechercher sur Google n’est pas une science exacte et il faut bien souvent tâtonner pour réussir à obtenir ce que l’on cherche.
Comme nous l’avions mentionné précédemment, on entrera des requêtes simples avec chacune de ses questions. En fonction des résultats obtenus, on pourra zoomer pour mieux cibler la recherche ou dézoomer si la requête était beaucoup trop précise.
Pour ce faire, l’internaute a toute une panoplie de fonctionnalités et d’options disponibles.
Utiliser les filtres et opérateurs disponibles
Filtres et options utiles sur Google |
Opérateurs utiles sur Google |
Filtre par dates |
|
Paramètres de région |
|
100 résultats par page |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Comme Google fait une sélection d’informations qu’il juge pertinentes, il est intéressant de tester de nombreuses variantes pour une même requête. Les résultats seront bien souvent très différents à chaque fois et complémentaires.
Ce n’est pas parce qu’il faut faire simple avec Google qu’il ne faut plus utiliser d’opérateurs avancés, bien au contraire. Ils permettront de zoomer progressivement sur ce qui nous intéresse.
Sur ce sujet, nous conseillerons la lecture de l’article « Peut-on innover sur les opérateurs de recherche en s’inspirant du SEO, de l’OSINT …et des hackers ? » (BASES n° 385 – octobre 2020) ainsi que le blog Boolean Strings spécialisé sur la problématique des opérateurs sur Google, mais aussi les réseaux sociaux.
Tirer parti de détails et indices repérés dans les premiers résultats
Pour zoomer sur un point précis de sa recherche, on a tout intérêt à repérer rapidement des éléments et détails distinctifs et non ambigus pour donner de la matière à Google.
Par exemple, pour notre recherche sur le marché des lapins domestiques, on remarque dans plusieurs résultats qu’il y a des références à un sondage annuel sur le marché des animaux domestiques mené par la Facco (fabricant de nourriture pour les animaux domestiques) et Kantar.
On pourra alors explorer plus en détail cet aspect-là et obtenir plus de détails sur les données contenues dans ce sondage en entrant par exemple la requête suivante :
évolution lapins en France Facco
Tirer parti des résultats locaux et de la personnalisation des résultats
Comme nous avons pu le rappeler dans l’article « Sortir de la recherche géolocalisée sur Google avec VPN, extensions...: quelle est aujourd’hui la meilleure solution ? » (BASES n° 395 – septembre 2021), Google personnalise les résultats selon la localisation de l’internaute. Si vous recherchez des informations liées à un pays différent de celui dans lequel vous vous trouvez, vous avez tout intérêt à utiliser des systèmes pour contourner cette géolocalisation forcée. Et d’après nos tests, rien de mieux que les VPN ou des extensions comme Geosearch pour parvenir à avoir des résultats locaux (Cf. Figure 3. Geosearch).
Figure 3. Geosearch
La personnalisation des résultats ne semble plus se limiter uniquement à la localisation de l’internaute. Les résultats de recherches effectuées par une même personne peuvent varier selon le support utilisé, s’il est connecté ou non à un compte Google, etc.
On aura intérêt à tester différentes configurations pour une même requête (sur ordinateur, sur mobile, en étant connecté ou non, en utilisant le mode incognito, etc.) car les résultats peuvent être complémentaires.
Rechercher la source plutôt que l’information finale
Une autre méthode qui fonctionne plutôt bien consiste à utiliser Google pour trouver la source plutôt que l’information finale.
Pour notre recherche sur le marché des animaux domestiques en France, il peut être intéressant de rechercher des sources susceptibles de traiter du sujet. On pensera par exemple à chercher des associations, magazines, etc.
Une fois qu’on a identifié des sources intéressantes, on peut aller les explorer directement ou bien interroger Google avec l’opérateur site:
La requête
site:https://www.30millionsdamis.fr/
marché animaux domestiques nous a par exemple permis d’identifier un article intitulé « Le marché des animaux de compagnie ne connaît pas la crise » datant de 2021 que nous n’avions jamais vu apparaître lors de nos requêtes précédentes.
Tirer parti des verticales de Google
Google, ce n’est pas uniquement le moteur Web, c’est aussi tout un écosystème d’outils de recherche spécialisés qui peuvent apporter des résultats spécifiques.
- Google Actualités va permettre de se focaliser sur les contenus presse/médias. On rappellera qu’il vaut mieux l’interroger depuis le moteur Web de Google puis en choisissant l’onglet Actualités. Les fonctionnalités et le nombre de résultats sont généralement plus nombreux qu’en passant directement par l’interface dédiée de Google News.
- Google Images va permettre de repérer des contenus utilisant des éléments visuels comme des tableaux, graphiques ou encore des infographies. Utiliser Google Images pour rechercher sur le marché des animaux domestiques permet de repérer instantanément des infographies et graphiques pertinents que l’on ne retrouve pas dans le moteur Web. L’index de Google Images n’est d’ailleurs pas le même que celui du moteur Web.
- Google Scholar va être intéressant pour retrouver gratuitement un article académique dont on connaît déjà le nom ou pour explorer les réseaux de citations d’articles scientifiques et académiques. La grande force de Google Scholar réside en effet dans la taille de son index et dans sa capacité à indexer le texte intégral des articles scientifiques. Pour les autres besoins liés à l’information scientifique et technique, il y a d’autres moteurs beaucoup plus performants comme Dimensions ou The Lens par exemple.
- Google Books va être utile pour retrouver des documents anciens (articles scientifiques, ouvrages anciens, etc.)
- Google Vidéos est intéressant pour rechercher des vidéos et a l’avantage de disposer d’un corpus assez vaste intégrant les grosses plateformes comme YouTube, les vidéos issues des réseaux sociaux ou des vidéos présentes sur des sites web individuels. La recherche ne porte que sur les métadonnées des vidéos, mais l’on peut espérer qu’un jour il sera possible de rechercher sur la transcription de l’audio.
- Google Dataset search permet de rechercher spécifiquement sur des jeux de données (données publiques et données de la recherche), ce qui peut être utile quand on cherche des données chiffrées. Pour notre recherche, on y trouve plusieurs jeux de données liés aux animaux domestiques, mais les données sont malgré tout un peu anciennes…
- Google Podcast permet de rechercher des podcasts ou des épisodes de podcasts. Comme pour les vidéos, on ne cherche que sur les métadonnées. Google Podcasts n’est certainement pas le meilleur outil pour rechercher des podcasts aujourd’hui. Listen Notes est par exemple bien meilleur.
- Google CSE, le moteur personnalisé de Google n’est pas à négliger. Il va permettre de lancer des recherches sur une liste restreinte de sources définies par l’utilisateur, mais il va aussi permettre d’interroger le web et l’index de Google d’une autre manière. En effet, Google n’utilise pas du tout les mêmes algorithmes que sur son moteur Web. Il n’est pas question ici des algorithmes BERT ou encore MUM et le moteur continue davantage à rechercher des mots-clés qui correspondent à notre requête qu’à tenter de détecter notre intention de recherche. Cela permet d’avoir des résultats très différents et donc complémentaires.
Et si Google persiste dans la mauvaise direction
Si Google s’obstine à ne pas comprendre notre requête et à ne pas nous mener dans la bonne direction, on peut toujours lui forcer un peu la main :
- Soit en utilisant le paramètre « mot à mot » où l’on force Google à ne pas interpréter et à ne pas recourir aux synonymes et termes proches ;
- Soit en utilisant l’opérateur intext: pour forcer Google à rechercher un mot-clé sur une page et à ne pas le laisser tomber en cours de route ;
- Soit en utilisant les guillemets pour la recherche d’expression exacte ;
Il semblerait que la meilleure manière de forcer Google à rechercher spécifiquement les termes que nous avons entrés soit d’utiliser l’option « mot à mot », accessible dans le menu « Outils » après une première recherche.
Google pour les questions complexes, mais pas que…
Pour finir, utiliser Google pour des questions complexes n’a rien d’impossible. Il faut bien avoir conscience que Google n’est pas ou plus conçu pour les questions complexes et il va donc falloir être pédagogue et décomposer sa question en plusieurs questions plus simples.
Il faut également garder en tête que Google interprète notre question et sélectionne l’information et il faut donc lui donner les éléments nécessaires pour qu’il l’interprète correctement et sélectionne les éléments les plus adaptés.
Une recherche complexe sur Google ne se réalise pas en cinq minutes et nécessite d’explorer, relancer des requêtes plus ou moins précises et de faire varier de nombreux paramètres.
Et surtout, si Google a toute sa place dans le cadre d’une recherche d’information complexe, il ne peut pas être le seul outil utilisé en raison de son instabilité et de cette vision parcellaire de la réalité. On se devra de compléter sa rechercher avec d’autres moteurs web, thématiques, réseaux sociaux, mais aussi, dans la mesure du possible, des outils de recherche professionnels.