On ne présente plus Google Alertes, ce service d’alertes de Google lancé en 2004 qui permet de surveiller les nouveaux résultats apparaissant sur le moteur pour une requête donnée.
Longtemps indispensable pour la veille, Google Alertes a perdu de sa splendeur depuis quelques années : baisse du nombre de résultats et de la qualité des alertes, absence d’intérêt et d’investissement de Google pour cet outil historique et, plus récemment, problèmes récurrents de spams et de malwares qui viennent parasiter les résultats des alertes.
Bref, on ne serait pas surpris si Google décidait de fermer son service au cours des prochaines années comme il l’a fait avec tant d’autres services utiles aux professionnels de la veille.
Lire aussi :
Les réseaux sociaux atypiques : une opportunité pour le veilleur ?
La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.
On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.
Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).
Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…
Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.
Google News, ou Google Actualités dans sa version francophone, est l’un des services incontournables de Google pour les veilleurs et les professionnels de l’information. Il peut paraître plutôt simpliste a priori, mais les moyens d’y accéder et de le surveiller ne sont pas si limpides.
C’est pourquoi nous nous proposons de faire ici un point sur son contenu, son histoire, ses points d’accès et enfin les différents paramétrages, méthodes et outils à disposition pour surveiller une requête dans Google Actualités, qui comme on va le voir, peuvent faire considérablement varier les résultats.
L’identification de sources locales couvrant des zones lointaines présente plusieurs difficultés, liées notamment à la langue ou au manque de connaissance du pays.
Une fois que l’on aura levé ces premières barrières, le moyen qui semble le plus évident pour l’identification de telles sources est d’utiliser tout simplement un moteur de recherche, en particulier Google. Cependant, un certain nombre d’étapes est indispensable pour obtenir plus de résultats et de meilleure qualité. On ne négligera pas non plus d’autres outils de recherche de type annuaires ou pages de liens.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Les outils professionnels suffisent-ils pour s’aventurer en territoire inconnu ?
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ?
Les obstacles à la recherche d’informations financières d’entreprises à l’étranger
Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.
Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.
Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND
(par défaut), OR
et NOT
(matérialisé sous la forme d’un tiret -
).
Qu’il s’agisse de trouver des données macro-économiques, des statistiques, des données démographiques, etc., il est souvent préférable de débuter avec des sources et outils spécialisés sur ce type de données , comme nous avons pu le voir dans le précédent article « Méthodologie et outils pour la recherche de statistiques».
Malheureusement, ces grandes sources ne permettent pas toujours de répondre à l’ensemble des besoins informationnels. Des moteurs de recherche classiques peuvent guider l’internaute vers les données dont il a besoin ou bien il faut se tourner vers des sources bien plus spécialisées.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Trouver des informations financières : un exercice de recherche coûteux en efforts et en ressources
Economiser du temps grâce aux outils d’extraction de données
Avec Google, impossible de s’ennuyer, car l’actualité ne s’arrête jamais : nouveaux produits, évolutions de fonctionnalités, revirement de stratégie, etc. Et ce début d’année 2020 ne manque pas de nouveautés qui vont venir impacter le quotidien des professionnels de l’information pour le meilleur et pour le pire.
Les évolutions majeures concernent peu le moteur Web de Google mais surtout ses verticales thématiques : Google Datasets, Google Podcasts, ou encore Google Actualités.
Le terme « agrégateur de presse » est indissociable de la recherche d’information presse mais il revêt aujourd’hui de multiples dimensions.
A l’origine, le terme faisait exclusivement référence aux agrégateurs de presse payants comme Factiva, Nexis, Press’edd, etc. qui fournissaient un outil de recherche mais également un accès au texte intégral à tous les articles de presse qu’ils indexaient.
Aujourd’hui, la grande majorité de ces acteurs intègrent des contenus plus larges (blogs, médias sociaux, sites, etc.) et se contentent pour certaines sources de crawler les sites Web sans donner accès au texte intégral.
Lire aussi :
Quelles alternatives crédibles à Google Actualités en 2020 ?
Les agrégateurs de presse payants ont-ils toujours de la valeur ?
Nous avons pu voir dans l’article « Google Actualités : la tendance n’est pas au beau fixe » de ce dossier spécial que Google Actualités s’avérait de plus en plus décevant dans un contexte professionnel et que de récentes annonces ne faisaient d’ailleurs que venir noircir un peu plus le tableau.
Des alternatives gratuites à Google Actualités existent depuis des années… mais jusqu’ici aucune n’était réellement satisfaisante.
Lire aussi :
Les agrégateurs payants ont-il toujours de la valeur ?
Google Actualités : la tendance n’est pas au beau fixe
La première intervention de cette conférence annuelle à Londres revenait en détail sur le fonctionnement de la recherche sémantique, qui, rappelons-le, est aussi mise en œuvre dans des moteurs comme Google depuis quelques années.
Andreas Kaltenbrunner est directeur de la recherche chez NTENT, une société qui propose un moteur de recherche sémantique en marque blanche pour les entreprises.
Il est revenu en détail sur le fonctionnement de leur moteur. Pour créer un moteur sémantique, il faut tout d’abord une ontologie, un lexique (un par langue) associé à l’ontologie, un « onomasticon » (une sorte de glossaire des noms propres) et des règles linguistiques.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Depuis maintenant quelques années, le monde des moteurs académiques est en pleine ébullition.
La famille des moteurs académiques gratuits ne cesse ne s’agrandir. Après Dimensions, 1Findr ou encore Lens, voici un petit nouveau : Scinapse.
Scinapse, un nouveau venu au pays des moteurs académiques, affiche clairement ses ambitions depuis la page d’accueil : « We’re better than Google Scholar. We mean it. »
(« Nous sommes meilleurs que Google Scholar, nous le pensons vraiment »).
Pour interroger le Web visible, les professionnels de l’information continuent d’utiliser principalement Google, tout simplement parce que la pertinence des résultats reste bien supérieure à celles de ses concurrents.
La majorité des alternatives apparues au cours des dernières années se concentrent sur le respect de la vie privée à l’image de Qwant, DuckDuckGo, Ecosia, etc. Et malheureusement pour les professionnels de l’information, aussi intéressant que cela puisse être, cela n’améliore en rien la qualité et la pertinence des résultats. C’est même plutôt l’inverse...
Mais Google de son côté, même s’il reste meilleur, change très rapidement et ne cesse de se dégrader du point de vue de la recherche d’information professionnelle. Il faut bien l’admettre, nous ne sommes pas et ne serons jamais son public cible !
Il est donc crucial de continuer à chercher des alternatives ou du moins des compléments à nos outils actuels et notamment Google pour interroger le Web de surface, mais aussi accéder au Web profond.
Sur ce sujet, la France n’est pas la plus mal lotie avec de nouveaux outils venant se positionner sur de nouvelles façons de rechercher de l’information. Au cours des derniers mois, nous en avons repéré trois nouveaux, très différents dans leurs approches, stratégies et modèles économiques : Geotrend, Needle, Netguide.
Lire aussi :
Rechercher différemment - Dossier Spécial
La recherche d’information par géolocalisation
Tracer ses recherches pour gagner en expertise et en productivité
Google vient d’annoncer le lancement de deux nouveaux opérateurs de recherche liés à la recherche par date.
Il s’agit de des opérateurs before:AAAA-MM-JJ
ou before:AAAA/MM/JJ
et after:AAAA-MM-JJ
ou after:AAAA/MM/JJ
pour rechercher des résultats publiés avant ou après une certaine date.
Par exemple, after:2019-04-02
permet de limiter aux résultats publiés après le 2 avril 2019.
On peut également utiliser la syntaxe before:AAAA
et after:AAAA
et le moteur recherchera alors tout ce qui a été publié après le 1er janvier de l’année en question.
Cette fonctionnalité très utile, même si les dates de publication estimées par Google ne sont pas toujours parfaitement exactes, existe dans les filtres de Google depuis de nombreuses années. On peut en effet se rendre dans l’onglet Outil puis Date et choisir « moins d’1h », « moins de 24h », « moins d’une semaine », « moins d’1 mois », « moins d’un an » ou « période personnalisée ».
Lire aussi :
Presse, réseaux sociaux, contenus multimédia, littérature scientifique, données, etc. : rechercher sur des contenus très disparates
Quand peut-on clore sa recherche l'esprit tranquille ?
Search Lab : 3 méthodologies clé en main
Comment détecter des innovations de marché ?
La recherche d information appliquée aux personnes
Il est plus que jamais indispensable de se former en continu à ses problématiques métiers et de réaliser sa propre veille sur la veille pour rester un expert. Car le monde de l’information change de plus en plus vite.
Mais suivre l’actualité des acteurs et outils de la veille et de la recherche d’information est de plus en plus chronophage et souvent difficile à intégrer à ses tâches du quotidien...
Pour cette raison, nous avons décidé de consacrer désormais deux pages de chaque numéro de NETSOURCES à cette veille métier avec :
Lire aussi :
L’évolution de la frontière gratuit/payant impacte la veille stratégique et technologique
Quand les outils de veille intègrent les contenus payants à leurs offres
Retour sur le Challenge de la veille 2019
Si, comme nous avons pu le voir, le paysage des outils de recherche a évolué, c’est également la façon de les interroger qui a beaucoup changé en quelques années.
Au départ, tous les outils ou presque proposaient au minimum une recherche booléenne simple.
Par recherche booléenne, nous faisons référence ici à des requêtes structurées plus ou moins longues où l’on combine des mots-clés grâce aux opérateurs booléens classiques AND, OR, NOT mais aussi des opérateurs avancés (opérateur de proximité, recherche dans le titre, recherche sur un type de fichier, troncature, etc.).
Lire aussi :
Un regain d’énergie et de vitalité pour les outils de recherche
Google évolue, les documentalistes plus utiles que jamais
Comment bien interroger Google en 2018
L'information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ?
Le Web d’aujourd’hui s’émancipe de plus en plus du contenu textuel avec une part toujours plus importante de contenus multimédias. Et de fait, la recherche Web traditionnelle par mot-clé évolue également avec une progression importante de la recherche vocale et de la recherche visuelle et d’images.
Durant cette deuxième session de la journée Search Solutions 2018, il a été question de recherche vocale chez Google d’une part et de recherche d’images chez les journalistes d’autre part.
Lire aussi dans ce dossier :
Les moteurs de recherche vers toujours plus de recommandations de contenus
Si Google a choisi de lancer un nouveau moteur dédié aux datasets (https://toolbox.google.com/datasetsearch), ce n’est certainement pas par pur philanthropisme. Il y voit très certainement son intérêt et ambitionne de refaire avec les données ce qu’il a déjà fait avec les publications scientifiques et académiques à travers le moteur académique Google Scholar.
Google a très justement perçu l’importance de ce mouvement d’ouverture des données qu’il s’agisse de données publiques ou de données de la recherche, le manque d’homogénéité et de visibilité des initiatives existantes et l’importance de pouvoir y accéder facilement.
Et il ne compte pas passer à côté de cette opportunité de fédérer la recherche sur les données et de devenir la source de référence sur le sujet. Il le dit d’ailleurs lui-même :
« Dataset Search permet aux utilisateurs de trouver des ensembles de données sur le Web grâce à une simple recherche par mot-clé. L’outil présente des informations sur des ensembles de données hébergés dans des milliers de référentiels sur le web. Ces ensembles de données deviennent ainsi accessibles et utiles à tous. »
Lire aussi dans ce dossier :
Les Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Les données de la recherche : un nouveau pan de la recherche d’information scientifique et technique
Quelques rappels sur l’open data au service de la recherche d’information
Pas toujours facile de suivre toutes les évolutions de Google quand on sait par exemple qu’il modifie son algorithme plus de 1 600 fois par an. Heureusement, toutes ces modifications ne revêtent pas la même importance et toutes n’ont pas d’impact sur la recherche d’information professionnelle.
Toujours est-il qu’en ce mois de septembre, les nouveautés sont nombreuses et méritent d’être signalées.
On commencera donc par le lancement d’un nouveau moteur dédié aux données publiques appelé « Google Dataset Search » accessible à l’adresse suivante : https://toolbox.google.com/datasetsearch.
Malgré de nombreuses controverses et une stratégie à long-terme qui semble toujours s’éloigner un peu plus des problématiques et besoins des professionnels de l’information, Google est aujourd’hui encore le moteur de recherche Web le plus utilisé par la profession.
Cela s’explique par une raison très simple : malgré ses nombreux défauts, il propose des fonctionnalités de recherche plus avancées et fournit de meilleurs résultats que ses concurrents dans un contexte de recherche d’information et de veille professionnelle.
Meilleur, certes, mais tous les internautes accèdent-ils vraiment aux mêmes résultats ?
On se rappellera tout de même que Google nous vantait les mérites de la « recherche personnalisée » il y a encore quelques années.
Lire aussi :
Qwant peut-il devenir le moteur par défaut des professionnels de l’information ?
Les outils de recherche scientifiques et académiques gratuits, qui permettent de rechercher principalement des articles scientifiques mais également des monographies, compte-rendus de conférences ou encore thèses sont en pleine expansion.
Depuis le début de l’année, on a déjà pu voir apparaître deux nouveaux venus assez similaires, Dimensions et 1findr. Et à l’heure où nous écrivons ces lignes, les créateurs d’Unpaywall, l’extension de navigateur qui permet de savoir si un article est disponible ou non en libre accès (voir BASES n 350 – juillet/août 2017) vient d’annoncer le lancement prochain d’un moteur dopé à l’intelligence artificielle permettant de découvrir plus de 20 millions d’articles scientifiques en libre accès appelé Get the Research (http://gettheresearch.org/).
Et c’est sans compter sur Google Scholar qui est un quasi-réflexe pour bon nombre de chercheurs et qui existe quant à lui depuis 2004.
Quand il s’agit d’effectuer des recherches bibliographiques ou de réaliser une revue de littérature, Google Scholar apparaît généralement en tête de liste chez les chercheurs, universitaires, étudiants et même certains professionnels de l’information.
Une réalité qui est particulièrement surprenante, la rigueur de la démarche de recherche scientifique semblant a priori incompatible avec le mode de recherche très pauvre, proposé par Google Scholar dans des amas d’informations non structurées, et dont on ne connaît pas les contours.
Lire aussi dans ce dossier :
La perversité de Google Scholar
Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
Le volume important de documents contenus dans Google Scholar fait qu’il est extrêmement rare de ne trouver aucune réponse à n’importe quelle question un tant soit peu scientifique. Parmi ces réponses, le chercheur trouvera bien quelques documents intéressants parmi les premiers de la liste car on serait curieux de savoir combien vont examiner les 1 000 résultats visualisables (c’est la limite).
Ces résultats trouvés à partir d’une ou plusieurs recherches permettent le plus souvent de tirer quelques fils et de trouver quelques documents présentant un intérêt.
Et c’est là toute la perversité du système. Car l’accès à Google Scholar est gratuit et son contenu un des plus importants disponibles.
Lire aussi dans ce dossier :
Google Scholar est-il un véritable outil de recherche scientifique ?
Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
L’interface de Google Actualités (https://news.google.fr) a été profondément remaniée au mois de mai.
L’occasion pour nous de présenter ces nouveautés et évolutions ainsi que leur impact sur la recherche d’information et la veille, en en pesant le pour et le contre du point de vue du professionnel de l'information, sur différents aspects : interface, intégration de l'intelligence artificielle, collection de contenus, accès direct au payant,...
Derrière cette nouvelle version, se cache-t-il un changement de stratégie ?
Ce mois-ci, l’actualité des moteurs concerne exclusivement Google qui n’a pas faibli dans le nombre de ces annonces et lancements de nouvelles fonctionnalités.
Nous vous parlions le mois dernier du nouveau bouton « plus de résultats ». Pour certaines questions comme la météo par exemple, Google avait lancé un test où il n’affichait plus aucun résultat mais juste une réponse à la question posée suivie d’un bouton « plus de résultats » pour ceux qui souhaiteraient aller plus loin. Le test avait ensuite pris fin et tout était redevenu comme avant.
Dans un article publié sur notre blog « Google évolue : les documentalistes plus utiles que jamais », nous faisions le constat que Google affiche toujours moins de résultats et ce, quelle que soit la requête et alors que son index ne cesse pourtant de s’accroître.
Il annonce certes dans un premier temps des centaines de milliers voire des millions de résultats mais en se rendant sur la dernière page de résultats, on constate que leur nombre ne dépasse pratiquement jamais les 500.
Pour preuve, nous avions réalisé en 2011 une recherche sur les masques respiratoires. A l’époque, une requête sur l’expression masque respiratoire permettait de visualiser plus de 1 000 résultats dans Google. Aujourd’hui, la même requête n’en génère que 183.
Google et Bing se transforment toujours un peu plus en moteurs de réponses.
En ce début d’année, l’actualité est très riche du côté des moteurs de recherche.
Google a récemment lancé un test où, pour certaines questions simples (comme l’heure qu’il est, convertir des unités ou des monnaies ou encore effectuer des calculs), il affichait directement la réponse sans proposer de liste de résultats naturels (voir figure 1.).
Et si l’on souhaitait accéder aux résultats naturels, il fallait alors cliquer sur un bouton « afficher tous les résultats ».
En ce début d’année, l’actualité de Bing et Google ne manque pas.
Et ce qui fait beaucoup parler, ce sont les featured snippets de Google et de Bing.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », le featured snippet constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
La recommandation de contenus prend une place toujours plus importante dans l’univers du Web avec l’accroissement de la recommandation humaine, lié d’une part, au développement des médias sociaux et des outils du Web 2.0 et d’autre part, à la multiplication des systèmes et algorithmes de recommandations automatiques, grâce aux progrès de l’informatique d’abord et plus récemment de l’intelligence artificielle.
Quand on pense aux systèmes de recommandations, on pense en premier lieu aux sites d’e-commerce tels que Amazon qui nous propose des produits similaires à ceux que nous consultons ou susceptibles de nous intéresser, Netflix qui nous recommande des séries et des films qui pourraient nous plaire ou encore Spotify qui nous signale des morceaux et artistes correspondant à nos goûts musicaux.
Mais aujourd’hui, la recommandation est partout et il ne se passe pas un mois sans que l’on ne voie surgir une nouvelle fonctionnalité ou de nouveaux outils grand public et professionnels nous promettant de nous faire découvrir automatiquement des contenus nouveaux qui pourraient nous intéresser et nous faire sortir de notre bulle informationnelle ou des contenus similaires à ce que nous consultons.
Premier événement en date : l’annonce du rachat de CEDROM-SNI, propriétaire de l’agrégateur de presse Europresse par Cision le 20 décembre dernier. On en sait pour l’instant assez peu sur ce qu’il va advenir d’Europresse et de tous ses clients sur le sol français si ce n’est que cela va apporter « une excellente complémentarité stratégique » et « permettra de renforcer l’offre internationale » de Cision. Nous enquêterons donc sur les conséquences à court et long-terme de ce rachat et la nouvelle place de Cision dans le paysage de la veille, qui, rappelons-le, avait déjà racheté l’Argus de la presse cet été.
Autre rachat : celui de Xilopix, l’éditeur du moteur français Xaphir (pour lequel nos tests avaient été peu concluants) par le moteur français également Qwant. Les deux équipes travailleront ensemble pour développer des solutions de recherche adaptées au respect de la vie privée.
Enfin, l’outil de curation de contenus Storify, que certains de nos lecteurs connaissent et utilisent vient d’être acquis par la start-up américaine Livefyre spécialisée dans la curation de contenus et l’engagement d’audiences, elle-même acquise par Adobe en mai 2016. Storify fermera ses portes en mai 2018 et deviendra une fonctionnalité de LiveFyre qui est par contre un outil payant.
La lutte contre les fake news était un des thèmes central de l’année 2017. Et de nouvelles initiatives voient régulièrement le jour.