Tirer parti de la "colonne d'outils" de Google

Google a lancé il y a plus d’un an – en mai 2010 exactement – sa nouvelle interface «Google Jazz», avec une page de résultats notablement modifiée par l’apparition, sur la gauche, d’une colonne d’outils.

Composée de deux modules pouvant être déployés, cette colonne a pour objectif de mettre en avant des fonctionnalités de Google, qui peuvent s’avérer précieuses lors de certaines recherches.
Dans les faits cependant, les divers échanges que nous avons pu avoir avec d’autres professionnels – lors de conférences, formations ou rencontres – nous ont montré que, dans la grande majorité des cas, les internautes n’avaient pas pris le temps d’explorer cette colonne et n’avaient donc pas conscience de ses possibilités.

Eu égard à sa richesse, il nous a semblé utile de revenir sur le contenu de cette colonne dans un article, même si certaines fonctionnalités ont déjà été abordées au détour de la rubrique «Méthodologies de recherche»...

Mais décrivons tout d’abord les modifications apportées par Google à sa page de résultats.

Après avoir lancé une requête, on obtient une page de résultats composée de deux ensembles :

- la partie centrale affiche classiquement la liste des pages sélectionnées avec, pour chacune, son titre, l’URL et un bref extrait.

On notera que cette liste de résultats a récemment été épurée et que les précieux liens «En cache» et «Pages similaires», qui figuraient sous l’URL, ont été supprimés (voir Netsources n°94).

Ces fonctions restent heureusement accessibles directement en utilisant les opérateurs cache:URL (cache:www.recherche-eveillee.com par exemple) ou related:URL (related:www.bases-publications.com), ou encore via le «bouton de prévisualisation» – symbolisé par des chevrons –, qui apparaît lorsque l’on fait glisser le curseur sur la droite des résultats ; en survolant ces chevrons, on affiche un aperçu de la page, surmonté le plus souvent des liens En cache et Pages similaires. 

- sur la gauche de l’écran, on dispose d’une colonne d’outils divisée en deux parties, dont le contenu varie selon les requêtes et dont chaque partie peut d’autre part être déployée.

Le premier niveau permet de restreindre la requête aux résultats d’un des modules de Google : Images, Maps, Vidéos, Actualités, etc.

En cliquant sur «Plus», on affiche la plupart des modules disponibles (Livres, Adresses, Blogs, Discussions, etc.) ; l’offre est donc sensiblement équivalente aux options proposées dans le haut de l’écran et qui, depuis le lancement de Google+, figurent dans une barre noire.

Jusqu’en juillet dernier, on trouvait dans ce niveau le module «En temps réel», qui  proposait d’interroger de façon très efficace les informations publiées en temps réel sur Twitter et d’autres réseaux sociaux.

Malheureusement, l’accord avec Twitter n’ayant pas été renouvelé (voir Netsources n°92), le module a été supprimé ; Google avait alors annoncé qu’il envisageait de remplacer ce module par des données issues de Google+...

La deuxième partie de la colonne offre quant à elle des possibilités bien distinctes des autres fonctions de Google.

Cette partie est par défaut réduite au minimum, puisqu’elle se limite le plus souvent aux options : Pages en français ; Pays : France et Pages en langue étrangères traduites.

Pour certaines requêtes cependant, d’autres choix sont proposés (Sites avec des images...), sans que l’on puisse  comprendre clairement les raisons qui déterminent (ou non) leur affichage.

Quoiqu’il en soit, un lien «Plus d’outils» est systématiquement présent dans le bas de la colonne et permet de la déployer.

Différentes fonctions, plus ou moins utiles, sont alors offertes.

Nous les décrirons ci-après, en commençant par le bas de la colonne.

- Mot à Mot : cette fonctionnalité vient de faire son apparition dans la colonne d’outils de l’interface française, quelques semaines après avoir été ajoutée à l’interface américaine (où elle se nomme «Verbatim»).

Elle a pour objectif de pallier la suppression récente de l’opérateur + et permet d’exiger une recherche «exacte» (avec ou sans accents, au singulier ou au pluriel, ou encore sur des mots «vides»...).
             
D’une façon générale en effet, Google a tendance, de plus en plus fréquemment, à «interpréter» la requête et à sélectionner des résultats contenant des mots «proches» (et non strictement identiques, comme c’était le cas au départ).
           
Il pratique ainsi très souvent une troncature implicite, en recherchant par exemple automatiquement les formes pluriel et singulier des mots ; cette façon de faire est plutôt positive pour l’internaute néophyte – qui n’a pas conscience de l’importance des termes qu’il saisit –, mais peut être dérangeante pour le professionnel de l’information, d’autant que cette troncature est appliquée par Google «quand il le juge utile» (!), sans qu’il y ait de véritable règle (elle n’est donc pas systématique).
             
On notera que cette «interprétation» de la requête peut aller jusqu’au remplacement de certains mots par d’autres ; une recherche avec veille Russie par exemple sélectionne des pages contenant vieille Russie...
             
Jusqu’à il y a peu, la règle était d’utiliser le symbole + collé devant le mot pour «forcer» la recherche sur l’occurrence exacte du mot. Mais suite au lancement de son réseau social, le moteur a modifié sa syntaxe et a remplacé le + par les guillemets.
             
La fonction «Mot à Mot» est donc l’équivalent des guillemets, et pourra être utilisée pour imposer à Google de rechercher un terme tel qu’il est écrit, l’accentuation étant alors prise en compte ; on pourra ainsi éviter, par exemple, qu’une requête avec les termes marché nordique obtienne des réponses concernant la marche nordique...

- Réseaux sociaux apparaît uniquement lorsque l’on est connecté avec son compte Google, et permet de restreindre la recherche aux pages «partagées» publiquement par les personnes que l’on suit sur Google+ (voir Netsources n°93).                                  

Sous chaque page, figurent alors le nom et l’avatar (le plus souvent une photo) du contact, avec la mention qu’il a «partagé ce résultat» ou qu’il a cliqué sur le bouton «+1».

A l’heure actuelle néanmoins, cette fonctionnalité souffre de plusieurs faiblesses, la principale étant son algorithme de classement, qui ne semble pas très cohérent et ne permet pas de tri chronologique...
             
- Dictionnaire a le même usage que l’opérateur define:mot et affiche des définitions, identifiées automatiquement par Google dans des pages issues de lexiques, dictionnaires, glossaires, etc.
             
On notera que l’utilisation de l’opérateur define: a changé il y a quelques mois et se fait désormais en deux étapes : après avoir lancé une requête avec, par exemple, define:rss, il faut cliquer sur le lien «Plus d’infos» situé sous le premier résultat (Définition de rss :) pour afficher la liste des définitions, alors qu’auparavant, on obtenait directement cette liste.

- Recherches associées est un peu l’équivalent de Google Suggest – l’encadré qui affiche des suggestions de requêtes, au fur et à mesure de la saisie des lettres –, et propose des expressions contenant les mots de la requête, parmi celles les plus souvent saisies par les internautes.

On notera qu’en complément de cette fonction, Google proposait au départ la «Roue magique» qui affichait, à la façon des «termes associés» d’Exalead (voir Netsources n°81), une roue proposant des concepts proches des mots de la requête (voir Netsources n°83). Cette fonctionnalité a été discrètement supprimée il y a quelques mois.
              
- Sites avec des images vient en complément de la recherche sur le module «Images» et affiche, non pas les pages pertinentes contenant une image, mais les images contenues dans les sites pertinents..

Si ces diverses fonctionnalités peuvent quelquefois s’avérer utiles, leur intérêt est faible comparativement aux deux options suivantes qui, à notre avis, constituent l’un des points forts de Google.

Pour illustrer leur puissance, nous les présenterons à partir du traitement d’une question concrète : «comment identifier des données statistiques sur l’industrie textile en Chine ?».

Pour obtenir la réponse à une question de ce type, le premier réflexe est en général de tenter sa chance sur Google avec des mots généralistes comme statistiques industrie textile Chine.

Suivent alors quelques secondes d’intense suspense au cours desquelles on espère découvrir parmi les résultats des pages ayant par exemple pour titre «l’industrie textile en Chine : statistiques 2011»...

Malheureusement, les résultats escomptés ne sont pas toujours au rendez-vous et cet exemple ne fait pas exception.

Si Google annonce que «1 250 000 résultats» répondent à la question, les premiers offrent des données pertinentes ... mais anciennes («L'industrie textile chinoise, novembre 2006» ; «Textile chinois et Union européenne, septembre 2005», «Le textile chinois va t-il supplanter le textile européen, novembre 2005»)... ou des données récentes mais non pertinentes («Conjoncture dans l’industrie textile belge en 2010 et début 2011» ...).

L’un des critères de «non-pertinence» ayant été identifié (la date de publication des données), nous allons pouvoir le «neutraliser» afin d’améliorer les résultats. Pour ce faire, il suffit d’utiliser la fonction «Date», qui se trouve dans la colonne d’outils.

Peu mise en avant – il faut cliquer sur «Plus d’outils» pour y accéder –, cette fonction s’avère extrêmement utile pour les professionnels et répond à un besoin récurrent : affiner la sélection selon la date de publication des résultats.

Google précise en effet dans son aide qu’il s’agit bien d’une date de publication – et non d’une date de mise à jour par le robot –, qui est estimée par le moteur «à partir de diverses informations telles que la date d’indexation initiale de la page par Google».                     

Néanmoins, cette estimation n’est pas infaillible et l’on peut découvrir ça et là des pages publiées à une autre date que celle indiquée. Google précise que cette option fonctionne de manière optimale pour les pages publiées après 2001.

Une fois la colonne déployée, on obtient sous le champ «Date» – «Date indifférente» est sélectionnée par défaut – différentes options pour restreindre la sélection aux pages publiées il y a «Moins d’une heure», «Moins de 24 heures», «Moins d’une semaine», «Moins d’un mois», «Moins d’un an» ou encore au cours d’une «Période personnalisée».

Cette dernière option peut être utilisée lorsque l’on souhaite retrouver des documents publiés au cours d’une période précise, dont on aura indiqué la date de début et de fin. Elle s’avère utile pour appréhender, par exemple, les retombées sur le Web d’un événement particulier, mais aussi pour comparer le traitement d’un sujet au fil des ans.

On notera que lorsque l’on utilise la limitation par date, la date de publication estimée est alors clairement indiquée pour chaque résultat. Ceux-ci peuvent d’autre part être triés par pertinence (choix par défaut), ou par date (ordre ante-chronologique).

Pour notre recherche de statistiques sur l’industrie textile en Chine, il suffit de cliquer sur le choix «Moins d’un an» pour repérer un certain nombre de données pertinentes, comme par exemple :

- des «Statistiques sur les produits textiles» publiées par l’Union européenne en septembre 2011, et donnant quelques chiffres concernant (notamment) la Chine, de 2006 à 2010 ;

- des articles récents sur la production et les exportations de textile en Chine ;

- un rapport de l’Union des industries textiles avec les chiffres-clés (2010) de l’industrie du textile dans le monde (dont les principaux fournisseurs, exportateurs...).
             
Si la stratégie est encore loin d’être optimisée, la simple restriction aux documents de moins d’un an s’avère toutefois efficace.
             
On signalera que le moteur Exalead propose lui aussi un opérateur spécifique pour restreindre la requête selon la date de publication ; il suffit d’ajouter à la stratégie after:dd/mm/aaaa et/ou before:dd/mm/aaaa.

- Pages en langue étrangère traduites

La deuxième option est spécifique à Google et tire parti de l’outil de traduction, qu’il a lancé en 2007 (voir Netsources n°68).

Utilisant au départ la technologie Systran, Google a très vite pris son indépendance pour développer son propre outil, qui propose aujourd’hui de choisir indifféremment une langue source et une langue cible, dans une liste de 52 langues (de l’afrikaans au yiddish, en passant par le coréen, le swahili et le tagalog !), soit plus de 2 700 combinaisons de langues !

Le point fort de cet outil est qu’il propose non seulement de traduire un texte du français vers l’une des 52 langues au choix (et inversement), mais aussi de traduire en français une page web écrite dans une autre langue et surtout, qu’il permet de «traduire des résultats» issus de pages dans une langue étrangère.

Concrètement, l’internaute saisit la question qu’il souhaite poser dans sa langue et indique la langue des pages sur lesquelles il souhaite faire sa recherche.

Google traduit alors la requête dans la langue indiquée, interroge le Web, puis retraduit en français les résultats obtenus.

On peut ensuite, au choix, cliquer sur le titre de la page traduite en français – et Google traduit à la volée le texte intégral de la page – ou cliquer sur le titre dans sa langue originale (et l’on affiche la page originale).

L’accès à cette fonctionnalité de traduction des résultats peut se faire de deux façons :

- depuis le lien «Outils linguistiques» proposé dans le menu Options – symbolisé par une roue dentée, en haut de la page d’accueil de Google –, et en utilisant le choix «traduction des résultats» ;

- en cliquant sur le choix «Pages en langue étrangère traduite» de la colonne d’outils.

Dans ce dernier cas, c’est Google qui choisit automatiquement les langues des pages qu’il interroge, et il faut cliquer sur «Ajouter une langue» pour modifier les langues sélectionnées par défaut.

Dans notre cas, après avoir lancé la recherche avec les mots statistiques industrie textile Chine et cliqué sur le lien «Pages en langue étrangère traduites », on obtient des résultats issus du Web en anglais et en chinois ; on peut alors décider de n’interroger que le Web en chinois, ou au contraire d’ajouter d’autres langues.

En survolant les résultats, on repère immédiatement des sources très pertinentes, susceptibles de fournir un certain nombre de renseignements, comme par exemple :

- le centre de statistiques du China Textile Industry Association ; on trouve sur le site (l’original est en chinois) les noms des principales sociétés dans l’industrie textile du coton, du chanvre, de la soie, de la teinture..., ainsi que la liste des associations du domaine ;

La page d’accueil du site (traduite en français) propose par ailleurs, dans un petit onglet, quelques données statistiques qui défilent et sont également traduites ; elles offrent des informations récentes sur les exportations, importations, production, revenus d’entreprises, etc.

- la Chambre de commerce chinoise de l’industrie textile (CCPITTEX) propose quant à elle sur son site (en anglais) une rubrique «Textile Information», avec un fil de dépêches sur le sujet, dans lesquelles on peut trouver des données statistiques («China's textile industrial output up 29% in Q1-Q3»...) ;

- un article (en anglais) du site thailandais FashionBiz intitulé «China Textile Industry Report 2010-2011» fournit de nombreux chiffres sur le sujet ;

- des articles sur le sujet (en anglais) tirés du ChinaDaily.com.cn ;

- on découvre également des résultats issus de Textination.de, un portail allemand dédié au textile  (en anglais et en allemand), et qui offre en particulier une lettre hebdomadaire sur l’industrie chinoise du textile et de l’habillement ! On peut consulter tous les numéros de cette lettre en texte intégral, du 3 janvier 2006 au 27 décembre 2011...

Chacun de ces résultats peut être consulté dans sa version originale ou traduite en français. Cette dernière peut bien sûr prêter à sourire (surtout pour les traductions du chinois), mais elle permet toujours de comprendre le sens général...

Que ce soit avec la fonction «Date de publication» comme avec «Pages en langue étrangère traduites», Google offre aux professionnels deux outils puissants, et l’on regrettera qu’il les mette si peu en avant.



Béatrice Foenix-Riou
Publié dans le n° 95 de Netsources (Novembre-Décembre 2011)

Aucun commentaire:

Enregistrer un commentaire