Explorer les sources dans d'autres langues


Lorsque l’on désire obtenir des informations sur une personnalité ou une entreprise étrangère quelle qu’elle soit, le réflexe le plus fréquent est d’interroger un moteur de recherche tel Google, et de saisir le nom de l’entreprise ou de la personne.
             
Dans la majorité des cas, on obtient alors une liste de très nombreuses pages comportant le ou les mots de la requête.
             
Quelquefois cependant, lorsque le sujet de la recherche est de moindre renommée, le nombre de résultats est insuffisant, ou ceux-ci ne sont guère satisfaisants.

            
Il peut alors être utile d’explorer des sources issues du pays dont est originaire la personne ou l’entreprise, en utilisant les fonctionnalités de l’outil Google Traduction (voir p.12).
            
Lors de récentes formations à la recherche experte sur le Web(1), nous avons rencontré, au cours d’exercices pratiques, des cas concrets que nous avons choisis de décrire ici.
           
Ils représentent en effet une bonne illustration de la méthodologie, qui pourra être reproduite pour tout autre sujet.
             
Pour la réalisation d’un éphéméride, des participants avaient cherché sur le Net un certain nombre d’informations et, notamment, des données biographiques sur diverses personnalités (dates de naissance, de décès...). Si la plupart des réponses avaient été obtenues sans difficultés particulières, certaines recherches aboutissaient à des impasses, soit parce que les renseignements n’étaient pas trouvés, soit parce que l’on obtenait des données contradictoires...
            
Nos formations étant centrées sur les problématiques des participants, nous avons tenté de trouver lors d’exercices pratiques de nouvelles pistes d’investigation.
            
La première “enquête” concernait le pianiste russe Evgeny Shenderovich, sur lequel il est difficile d’obtenir des renseignements d’ordre biographique.
             
Une recherche sur Google avec les simples mots Evgeny Shenderovich obtient certes 2 940 résultats “environ”(2), mais l’on s’apercoit très vite que nombre d’entre eux ne sont pas pertinents et concernent par exemple Evgeny Saburov et Victor Shenderovich...
            
L’utilisation des guillemets s’avère dans ce cas indispensable, mais elle est très restrictive et la requête “Evgeny Shenderovich” n’obtient plus que 45 résultats. Si le nom du pianiste apparaît bien dans les pages, ces dernières font pour la plupart référence à des disques et ne contiennent pas de données biographiques.
             
Pour élargir la recherche, il est ici important de penser à toutes les formes possibles du nom, à savoir “prénom nom”, mais aussi “nom prénom”, “initiale du prénom nom” et “nom initiale du prénom”, que l’on reliera avec l’opérateur OR.
             
La requête “evgeny shenderovich” OR “shenderovich evgeny” OR “e shenderovich” OR “shenderovich e” obtient 78 résultats.
             
Pour repérer plus rapidement les éventuelles pages contenant des informations biographiques, on peut combiner la requête précédente –  avec un AND implicite – aux différents termes, en français ou en anglais, susceptibles  d’être utilisés (naissance, “né le”, biographie, mort, disparition, décès, born, death... ).
             
Malheureusement, les quelques résultats obtenus avec la requête “evgeny shenderovich” OR “shenderovich evgeny” OR “e shenderovich” OR “shenderovich e” naissance OR +“né le”(3) OR mort OR disparition OR décès OR biographie OR biography OR born OR death confirment l’absence de données biographiques sur ce pianiste.
             
A ce stade, bon nombre d’internautes abandonnent leurs recherches en pensant que l’information n’est pas disponible sur Internet.
             
Et pourtant, en est-on si sûr ?
             
Plusieurs pistes en effet peuvent encore être explorées :
             
- les données peuvent être sur un site web que Google n’a pas indexé, mais que d’autres moteurs (Exalead, Yahoo!...) ont découvert.

La requête doit donc être posée à différents moteurs ou à un métamoteur ;
             
- à défaut d’être sur le “Web visible”, les informations peuvent être présentes dans des banques de données (Web invisible).
            
On peut en effet penser qu’il existe des banques de données dédiées aux personnalités de la musique (compositeurs, musiciens...), dans lesquelles on pourra trouver des renseignements d’ordre biographique sur ces dernières.
             
La méthode – assez longue – sera alors d’identifier ces banques de données (via des outils comme Les Signets de la BnF...), et de les interroger avec le nom du pianiste ;
             
- la dernière piste, la plus rapide à explorer, consiste à se dire que l’information sur un pianiste russe est susceptible de se trouver ... sur le Web visible en russe !
             
Pour vérifier rapidement cette hypothèse, le plus simple est d’utiliser l’outil Traduction de Google (Translate.google.fr ou lien “Outils linguistiques”, à droite de la zone de saisie).
             
Ce service, qui vient de s’enrichir de nouvelles fonctionnalités, permet en particulier de “traduire des résultats”.
            
Concrètement, l’internaute saisit la requête qu’il souhaite poser dans sa langue, indique la langue des pages sur lesquelles il souhaite faire sa recherche, et clique sur “Traduire et rechercher”.
             
L’outil traduit la question dans la langue indiquée (Evgeny Shenderovich est traduit en russe), interroge le web russe avec le mot et retraduit les résultats en français.
            
On peut alors, au choix, cliquer sur le titre du résultat traduit en français (et l’on obtient une traduction intégrale de la page), ou sur le titre dans la langue originale (en russe).
             
Dans notre cas, une requête sur les pages en russe avec le mot “Evgeny Shenderovich” obtient comme premier résultat la traduction d’une page intitulée “Eugene M. Chenderovitch ~ accompagnateur, compo-siteur, professeur ~”, et une autre “Eugene Chenderovitch. Bibliographie chrono-logique”.
            
Issues du même site (www.jerusalem-korczak-home.com), ces pages sont certes traduites dans un français approximatif, mais elles nous permettent néanmoins de comprendre qu’Eugène Chenderovich (c’est la traduction du nom en français) est né en 1918 à Rostov sur le Don et qu’il est mort en 1999 à Jérusalem.
             
En relançant la requête avec Evgeny Shenderovich 1918 OR 1999, on obtient plusieurs pages issues de sites différents (Electronic Jewish Encyclopedia...) qui valident les deux dates précédemment obtenues.
            
La deuxième difficulté rencontrée par certains participants concernait la vérification des dates de naissance et de décès de Miltiades Caridis, un chef d’orchestre germano-grec.
            
La difficulté de cet exercice est ici toute autre car, la renommée du chef d’orchestre étant importante, une simple requête sur Google avec les mots “Miltiades Caridis” obtient 19 600 pages avec, parmi les premières, des résultats issus de Wikipédia mentionnant “né à Gdansk en 1923 et mort à Athènes en 1997”.
             
Faut-il pour autant se contenter de cette information ?
             
La règle d’or est toujours de valider les renseignements obtenus, a fortiori quand ceux-ci doivent être utilisés dans un éphéméride accessible à tous. La simple citation dans Wikipédia ne peut suffire.
            
Le premier réflexe peut alors être de parcourir la liste des résultats pour voir s’ils sont cohérents ; pour simplifier cette étape, il est important d’avoir préalablement choisi dans les Paramètres de recherche (lien en haut de l’écran) l’option “Afficher 100 résultats par page”, au lieu des 10 résultats affichés par défaut.
             
On peut aussi relancer la requête avec “Miltiades Caridis” 1923 OR 1997, et analyser les réponses.
             
On découvre alors que si 1923 est unanimement citée comme date de naissance (certaines sources précisent même “9 mai 1923”), il existe des divergences quant à la date de décès.
             
La majorité des sources semble indiquer 1997, mais quelques sources a priori sérieuses (Classicsonline.com, Polyphonia.gr...) citent 1998.
Néanmoins, rien ne permet de trancher et de savoir quelle est la bonne date.
             
Dans un cas comme celui-ci également, il peut être intéressant d’utiliser les services de Google Traduction, afin de voir si l’on a parlé de la mort du chef d’orchestre dans une source grecque (pays dans lequel il vivait), allemande ou polonaise (il est né à Gdansk).
             
Depuis le lien “Outils linguistiques” de Google, on lance alors la requête “Miltiades Caridis” 1998(4) sur les pages en grec, allemand et polonais ; on obtient de nombreux résultats parmi lesquels on trouve :
            
- une dépêche de la Macedonian Press Agency datée du 2 mars 1998 et indiquant “Inhumé demain, l'éminent chef d'orchestre Miltiadis Karidis décédé hier à l'âge de 75 ans. (...)” ; la date exacte de sa mort serait donc le 1er mars 1998 ;
            
- une dépêche de l’agence de presse APA OTS datée du 3 mars 1998 qui, malgré une traduction quelque peu aléatoire, nous confirme néanmoins le décès récent du chef d’orchestre en Grèce (“Maintenant, l'orchestre a pour conducteur à l’autre regard, parce Caridis ces jours-ci dans son patrie grecque est mort”) ;
             
- en premier résultat enfin, un article intitulé “Discover Magazine : Requiem pour le conducteur”, tiré du site grec www.rizospastis.gr, qui semble particu-lièrement intéressant. Malheureusement, lorsque l’on clique sur le titre pour obtenir sa traduction, on obtient le message de Google “Désolé, nous ne pouvons pas traduire cette page”...
             
La page originale – en grec – s’ouvre en revanche correctement.
            
L’astuce consiste ici à copier le texte en grec ... et à le coller dans la zone prévue à cet effet dans l’outil Google Traduction.
             
Et l’on obtient la traduction d’un article daté du mercredi 4 mars 1998 indiquant “La mort le trouva debout effectivement sur le podium, laissant les plus pauvres grecs famille de musiciens. Le chef d'orchestre, directeur artistique de l'Orchestre symphonique national de l'ERT Miltiadis Karidis, est décédé à l'aube, dimanche dernier, à l'âge de 75 ans. (...)”.
Le 4 mars étant un mercredi, la date exacte du décès est bien le dimanche 1er mars...
            
La “bonne” information ne fait ici aucun doute ; les multiples sites qui indiquent un décès en 1997 ne font que propager une erreur, vraisemblablement due à une faute de saisie dans un site “de référence”...
             
Ce type d’erreur se rencontre malheureusement trop souvent,  eu égard aux nombreux “copié-collé” sans vérification...
             
L’outil Google Traduction prouve ici toute sa valeur..
            
(1) “Web visible, Web invisible, Web 2.0 : outils et méthodes pour être efficace dans vos recherches”. Formation inter (ou intra) entreprises organisée par FLA Consultants.
            
(2) Comme nous l’avions indiqué dans l’article “Les approximations de Google” (Netsources n°74), le chiffre annoncé par Google est toujours très “approximatif”. Ainsi, si le moteur annonce que “2 940 résultats environ” contiennent les mots de la recherche, on ne peut en fait  afficher que 287 résultats dans une première étape et 873 après avoir “relancé la recherche en incluant les pages ignorées”...
            
(3) l’expression “né le” est ici précédée du symbole +, pour que la recherche se fasse sur l’expression exacte (avec accent) et non sur la négation “ne le”.
            
(4) on ne peut utiliser l’opérateur OR dans Google Traduction (1998 OR 1997), car l’outil le comprendrait comme un mot et le traduirait...



Béatrice Foenix-Riou
Publié dans le n°83 de Netsources (Novembre/Décembre 2009)

Aucun commentaire:

Enregistrer un commentaire