Actualité "Googlienne"...

GOOGLE ACTUALITES : STATISTIQUES TEMPORELLES ET ARCHIVES
            
Lancé en septembre 2002 aux Etats-Unis et en mai 2003 en France, le module Actualités de Google permet d’effectuer une recherche par mots sur le texte intégral de pages issues plus spécialement de sites d’actualités, pages indexées et rafraîchies très fréquemment par les robots du moteur.
             
Jusqu’ici, il fallait utiliser Google.com pour interroger la presse anglophone et Google.fr pour lancer une recherche sur les pages en français, et l’on obtenait des articles ayant une antériorité d’un mois maximum.
             
Depuis septembre 2006, la version américaine disposait par ailleurs d’un service “Google News Archive”, qui permettait de retrouver – gratuitement ou de façon payante – des articles pouvant dater de 200 ans (voir Netsources n°64).
            
Google a récemment (et discrètement) apporté quelques modifications à ces services.
            
Les index des deux versions ont ainsi été regroupés et l’on peut désormais obtenir des articles récents en anglais depuis une recherche sur Google.fr, les articles en français étant néanmoins classés en priorité dans les résultats.
             
Cette fusion simplifie notamment la création d’alertes, pour qui souhaite surveiller simultanément la presse anglophone et francophone.
             
Mais le point le plus intéressant réside dans l’extension du service Archives à la version francophone, avec un lien permettant, depuis la page de résultats, de retrouver un certain nombre d’articles anciens, en accès libre ou non.
           
Ainsi, une recherche avec la requête intitle:“Google News” OR intitle:“Google Actualités” affiche par défaut les résultats parus dans les sites d’actualité depuis un mois. On peut affiner la date de publication en utilisant la recherche avancée – choix “articles ajoutés entre .... et ....” –, ou en cliquant sur l’une des options proposées dans la colonne de gauche : depuis une heure, depuis hier ou depuis une semaine.
             
Pour au contraire élargir la sélection, on dispose du lien “Archives”, avec les options “toutes les dates” ou “autres dates” (on indique alors deux années).
             
En cliquant sur l’une de ces options, on affiche une page de résultats comprenant des articles de plus d’un mois, classés par défaut par pertinence.
             
On notera que bizarrement, la recherche se fait ici uniquement sur les sources francophones ; il faudra interroger Google.com pour retrouver les anciens articles de la presse américaine.
            
Lorsque l’on interroge les archives, la liste des résultats est surmontée d’un graphique que Google nomme Timeline, qui représente sous forme d’histogramme le nombre d’articles – contenus dans Google Actualités – publiés par an. Cette fonctionnalité, jusqu’alors réservée aux archives américaines, est depuis peu également proposée pour les résultats web, sur la version Google.com uniquement (voir ci-après).
             
En cliquant sur une période donnée, on obtient le détail du nombre d’articles par mois, et l’on affiche les titres et résumés des articles concernés.
            
L’histogramme obtenu avec la requête intitle:“Google News” OR intitle:“Google Actualités” permet ainsi, par exemple, d’identifier immédiatement les premiers articles sur le sujet et de lire quelques réactions au lancement du service en France, de repérer les moments où il a fait parler de lui (en septembre 2006 notamment, lors de sa condamnation par la justice belge) et de suivre aisément les faits marquants de son actualité, puisque les articles traitant d’un même événement sont regroupés.
             
Dans le haut de la page, un lien Chronologie propose d’afficher une sélection d’articles d’actualité classés par ordre chronologique (du plus ancien au plus récent), choisis par Google parmi les articles pertinents les plus “populaires”.
           
L’utilisateur se contente d’indiquer (dans le bas de la page) le nombre de résultats qu’il désire : 10, 20, 50 ou 100.
             
Bien sûr, on ne dispose pas ici de tous les articles indexés à l’époque par Google Actualités. Bon nombre d’entre eux ont disparus depuis et ne sont plus accessibles que sur le site de l’éditeur.  
             
Des accords ont cependant été conclus avec un certain nombre de titres et, si la page de résultats affiche les extraits pertinents des articles, un clic sur le titre amène selon les cas au texte intégral de l’article sur le site de l’éditeur (c’est le cas notamment pour le Nouvel Observateur ou Libération), ou à une grille d’achat en formule “pay per view”, toujours sur le site de l’éditeur (Les Echos, Le Monde Interactif...).
            
NOUVELLES FONCTIONNALITES POUR GOOGLE IMAGES
            
Lors d’une recherche sur le module Images de Google, la page de résultats est surmontée d’un bandeau permettant d’affiner la sélection selon la taille de l’image (très grande, grande...) et son contenu.
             
Ce dernier choix permet par exemple de restreindre les résultats aux images contenant des visages (voir Netsources n°68), aux images issues de l’actualité, ou encore à certain type d’images  (dessins au trait, contenu photo...).
            
Un nouveau filtre vient d’être ajouté à ces options et porte sur la couleur des images.
           
Si le choix par défaut est “Toutes les couleurs”, le menu déroulant propose d’identifier rapidement des images dont la couleur dominante est rouge, jaune, orange, violet...
             
Une autre fonctionnalité fort intéressante, disponible cette fois-ci uniquement depuis la grille de recherche avancée, vient tout juste d’être ajoutée et permet de filtrer les résultats selon les droits d’utilisation des images.
            
Si la recherche se fait par défaut “sans tenir compte des licences”, on peut désormais préciser que l’on souhaite des images avec :
             
- réutilisation autorisée ;
             
- réutilisation à des fins commerciales autorisée ;
             
- réutilisation avec modification autorisée ;
             
- réutilisation avec modification à des fins commerciales autorisée.
             
Aucune précision n’est donnée par Google sur la façon dont il applique ces filtres, mais on remarquera qu’il reprend en fait les options des fichiers disponibles sous licence Creative Commons (réutilisables sous certaines conditions, demandées par le créateur du fichier), que l’on retrouve par exemple dans la recherche avancée de Flickr.com.
             
OPTIONS SUPPLEMENTAIRES POUR GOOGLE.COM
             
Depuis le mois de mai 2009, Google propose de nouvelles fonctionnalités sur les pages de résultats de sa version américaine.
            
Certaines de ces options étaient testées dans les Google Labs (www.googlelabs.com) depuis plusieurs mois.
             
Pour en tirer parti il faut, après avoir lancé une requête, cliquer sur le lien Show options proposé dans la barre bleue, en haut de la page de résultats, à droite de la mention Web.
            Un clic sur ce lien déploie une colonne sur la gauche, permettant d’utiliser plusieurs filtres :
            
• type de résultat : la sélection se fait selon le type de résultat, avec le choix entre All results (par défaut), videos, forums ou reviews. Dans ce dernier cas, on obtient un genre de “revue de presse” sur le sujet, avec une sélection de pages issues de sites de presse, communiqués de presse, sites institutionnels...
             
• date : any time (par défaut), recent results, past 24 heures, past week, past year ; il s’agit ici des choix “rechercher les pages web découvertes durant...” offertes sur la grilles de recherche avancée – et non “publiées sur le web durant... ;
            
• informations affichées : standard results (par défaut), images from the page, more text ; dans ce dernier cas, le résumé  textuel est plus long ;
            
• informations connexes : standard view (par défaut), related searches (on obtient une liste de recherches connexes sur le thème), Wonder wheel (concepts proches, présentés sous la forme d'une roue) et, selon les recherches, Timeline. Dans ce dernier cas cependant, contrairement aux actualités, le classement chronologique se fait selon les dates présentes dans les pages.
             
Ces diverses options apportent un réel plus aux internautes, en leur permettant d’affiner de façon pertinente la liste de résultats de Google. Espérons qu’elles seront mises en place rapidement sur les autres interfaces du moteur.
 


Béatrice Foenix-Riou

Publié dans le n° 80 de Netsources (Mai/juin 2009)

Aucun commentaire:

Enregistrer un commentaire