La semaine dernière, nous avions consacré un billet à la stratégie de Bing par rapport à Google : « La guerre Bing versus Google : Bing contre-attaque sur de nouveaux terrains » .
Dans cet article nous mentionnions Bing Custom Search, un moteur de recherche personnalisable lancé par Microsoft il y a quelques mois, qui n’est ni plus ni moins qu’un concurrent direct de Google CSE.
Les moteurs personnalisables représentent un intérêt indéniable pour la veille et la recherche d’information. Mais maintenant qu’il existe une alternative a priori crédible à Google CSE, lequel est le plus performant et dans quels cas choisir l’un plutôt que l’autre ? C’est ce que nous avons cherché à savoir cette semaine en comparant les deux services.
Depuis maintenant quelques années, Google propose sur la première page de résultats et, pour certaines requêtes seulement, des featured snippets, appelés en français extraits optimisés même si le terme français est beaucoup moins utilisé.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », il constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
Ainsi, si vous demandez à Google « qu’est-ce que la veille stratégique ? », un encadré apparaît au dessus des résultats naturels contenant une définition de la veille stratégique issue de la page Wikipédia du même nom. Il n’est ainsi même pas nécessaire de se rendre sur cette page Web pour avoir la réponse à sa question. Du moins, en principe...
Est-ce que ces résultats apporte une réelle valeur ajoutée et un gain de temps pour la recherche d’information ou bien au contraire représentent-ils un pas de plus vers la mort des moteurs de recherche et l’avènement de l’ère de l’assistance ?
Les concepts d’études de marché et de gratuité semblent à première vue antinomiques. Les études de marché ont la réputation d’être chères, très chères même...
Alors que se cache t-il derrière ces sites et organismes qui proposent des études de marché gratuites ou très bon marché ? Quel intérêt ces documents peuvent-ils avoir pour la veille et la recherche d’information ?
Derrière le terme « étude de marché » se cachent en réalité de multiples définitions.
Certains lui appliquent une définition très stricte : celle d’une étude longue combinant de manière équilibrée données sectorielles et vision stratégique et prospective d’un marché.
D’autres, au contraire, englobent toute forme de rapports ou d’études courtes ou longues incluant des données de marché.
Et les documents que l’on trouve gratuitement sur le Web relèvent principalement de cette seconde définition.
Depuis plus de 10 ans maintenant, Google a recours à ce qu’il appelle la « recherche personnalisée ».
Concrètement, cela signifie que Google personnalise la liste des résultats naturels de ses utilisateurs en fonction de différents critères : localisation, historique de recherche, historique de navigation ou encore présence et contacts sur les médias sociaux, etc.
Deux personnes effectuant une même requête au même moment n’ont donc pas nécessairement les mêmes résultats.
Et quand on sait que Google n’affiche en réalité pas plus de 200/300 résultats au maximum par requête, même s’il indique à première vue des milliers voire des millions de réponses, on risque vite de passer à côté d’informations et de sources pertinentes...
Lire aussi :
Google évolue, les documentalistes plus utiles que jamais ?
Toute recherche d’information débute généralement par une recherche sur un moteur de recherche web généraliste et bien souvent Google.
Comme nous avons pu le voir dans le dernier numéro de NETSOURCES n°154 (septembre/octobre 2021), Google est de plus en plus un assistant virtuel, très bon certes, qui sélectionne des informations qu’il va présenter à l’utilisateur. Et en faisant cela, il s’éloigne de plus en plus de l’exhaustivité que l’on peut chercher à atteindre dans le cadre de certaines recherches d’informations.
C’est pour cela qu’il est plus que jamais utile d’aller interroger d’autres moteurs qui pourront faire émerger des résultats différents et complémentaires.
Ces dernières années, plus aucun acteur n’essayait véritablement de concurrencer directement Google, à l’exception de Bing qui gardait malgré tout toujours un train de retard. Les nouveaux acteurs, souvent des métamoteurs, faisaient tous le choix de se positionner sur des créneaux différents de ceux de Google : moteur qui respecte la vie privée comme Qwant ou DuckDuckGo, moteur qui aide à la sauvegarde de la planète comme Ecosia ou encore Lilo, moteurs thématiques, etc.
Lire aussi :
Google n’est plus un moteur de recherche ni de réponses, mais un assistant virtuel
Le professionnel de l’info face à un Google en perpétuel mouvement
Comment utiliser Google pour des questions complexes ? Restez simple !
Comment trouver des outils de recherche d’information thématiques ?
Comment construire ses propres outils de recherche d’information thématiques ?
La société Aleph Networks, pionnière dans la cybersécurité sur le Dark Web, était présente sur le salon I-Expo/Documation 2020. A cette occasion, elle présentait son nouveau produit en cours de lancement « Aleph Search Clear » qui s’adresse à un tout nouveau public, celui de la veille concurrentielle ou stratégique et s’attaque pour le coup à un nouvel environnement Web bien connu des veilleurs : le Clear Web.
Le Dark Web et le Deep Web sont des espaces très instables qui tendent à ajouter ou retirer fréquemment des sites. Ils suscitent bon nombre de rumeurs et il est par conséquent important de démystifier les différents volets qui composent le Web.
Voir aussi :
ORCID et les autres outils d’identification des auteurs de publications scientifiques
Plateformes de veille : qu’ont-elles à offrir aux PME et TPE ?
La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.
On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.
Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).
Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…
Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.
En cette période particulière, l’actualité de la veille et de la recherche d’information est très différente du paysage habituel. Une majorité des actualités et informations traitent des ressources d’information autour du coronavirus, la gratuité temporaire de certains outils et sources d’information ainsi que du thème du télétravail.
L’identification de sources locales couvrant des zones lointaines présente plusieurs difficultés, liées notamment à la langue ou au manque de connaissance du pays.
Une fois que l’on aura levé ces premières barrières, le moyen qui semble le plus évident pour l’identification de telles sources est d’utiliser tout simplement un moteur de recherche, en particulier Google. Cependant, un certain nombre d’étapes est indispensable pour obtenir plus de résultats et de meilleure qualité. On ne négligera pas non plus d’autres outils de recherche de type annuaires ou pages de liens.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Les outils professionnels suffisent-ils pour s’aventurer en territoire inconnu ?
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ?
Les obstacles à la recherche d’informations financières d’entreprises à l’étranger
Dans le précédent dossier de NETSOURCES (n°145 - mars-avril 2020), nous avons vu qu’obtenir des informations financières sur une société peut s’avérer difficile. Ceci est d’autant plus vrai lorsque la cible est une entreprise de moindre taille et localisée sur un autre continent.
Les lecteurs situés dans les pays occidentaux ont l’habitude d’un cadre législatif obligeant la plupart des entreprises à déposer leurs comptes auprès d’un organisme étatique. De plus, ils sont habitués à rechercher et trouver des données concernant les entreprises présentes dans leur environnement économique, leur donnant une idée plus ou moins précise de la taille et des performances de leurs cibles. Ceci, notamment grâce à des sociétés spécialisées dans la collecte et la diffusion d’informations concernant les entreprises en Europe et en Amérique du Nord. On pensera notamment à Orbis, Dun & Bradstreet, Bloomberg, Refinitiv, mais aussi Société.com et Kompass. Le gratuit trouve toutefois ses limites et le coût d’utilisation de ces bases de données peut rapidement devenir conséquent.
Lire aussi :
Sourcing, de la théorie à l’épreuve de la pratique
Les outils professionnels suffisent-ils pour s’aventurer en territoire inconnu ?
Sourcing : peut-on faire l’impasse sur les recherches en langue locale ?
Comment identifier des sources d’information locales ?
Voir aussi le dossier -> NETSOURCES n°145 - mars-avril 2020
Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.
Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.
Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND
(par défaut), OR
et NOT
(matérialisé sous la forme d’un tiret -
).
Avec Google, impossible de s’ennuyer, car l’actualité ne s’arrête jamais : nouveaux produits, évolutions de fonctionnalités, revirement de stratégie, etc. Et ce début d’année 2020 ne manque pas de nouveautés qui vont venir impacter le quotidien des professionnels de l’information pour le meilleur et pour le pire.
Les évolutions majeures concernent peu le moteur Web de Google mais surtout ses verticales thématiques : Google Datasets, Google Podcasts, ou encore Google Actualités.
Pour la troisième année consécutive, nous avons assisté à la journée « Search Solutions » à Londres où se côtoient ceux qui font les moteurs (ingénieurs, data scientists, informaticiens, etc.) et ceux qui les utilisent (professionnels de l’information et du SEO).
L’intelligence artificielle et plus particulièrement le machine learning et le NLP (Natural Language Processing) étaient encore une fois au cœur de la très grande majorité des présentations.
Lire aussi :
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Après les moteurs spécialisés sur le juridique, le recrutement ou la santé, il a également été question de nouveaux moteurs qui tirent parti des contenus multimédia.
On le sait, les contenus multimédia prolifèrent et il est de plus en plus important de les inclure dans son dispositif de veille et ses recherches d’information. Pourtant, ce sont des contenus difficiles d’accès car peu représentés dans les outils traditionnels et surtout peu « recherchables » car la recherche ne porte généralement que sur les métadonnées.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Le SEO et la veille au défi des moteurs
La première intervention de cette conférence annuelle à Londres revenait en détail sur le fonctionnement de la recherche sémantique, qui, rappelons-le, est aussi mise en œuvre dans des moteurs comme Google depuis quelques années.
Andreas Kaltenbrunner est directeur de la recherche chez NTENT, une société qui propose un moteur de recherche sémantique en marque blanche pour les entreprises.
Il est revenu en détail sur le fonctionnement de leur moteur. Pour créer un moteur sémantique, il faut tout d’abord une ontologie, un lexique (un par langue) associé à l’ontologie, un « onomasticon » (une sorte de glossaire des noms propres) et des règles linguistiques.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Les moteurs de recherche spécialisés (recrutement, juridique, santé) étaient à l’honneur cette année.
Et tous ces acteurs s’intéressent à la façon dont ils peuvent faire évoluer leurs outils en tirant parti du développement de l’IA tout en restant à l’écoute de leurs utilisateurs.
Trois acteurs étaient venus présenter certains axes de recherche sur lesquels ils ont travaillé récemment pour améliorer leurs moteurs.
Nous commencerons avec un outil de recherche spécialisé dans le recrutement et les ressources humaines appelé Texternel, fondé en 2011 à Amsterdam. Il s’agit d’un moteur principalement utilisé par les services RH des entreprises et qui permet de rechercher sur des bases de CV et réseaux sociaux afin d’identifier les bons candidats pour un poste.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Très éloignée des autres présentations, celle de Dawn Anderson, spécialiste du SEO (Search Engine Optimization) était néanmoins intéressante dans la mesure où elle faisait écho à ce que vivent les professionnels de l’information.
Le monde du SEO et de ceux qui développent les moteurs sont des mondes avec très peu de connexions.
Le SEO est encore trop souvent perçu par les informaticiens comme des personnes qui manipulent les résultats de recherche et sont souvent associés à l’image du spam.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
L’évaluation des sources a toujours fait partie du métier de veilleur mais certaines évolutions récentes nous invitent à revoir la façon dont nous considérons chaque catégorie de sources.
Lire aussi : Comment l'instabilité des modèles de la presse en ligne ébranle les dispositifs de veille
On a en effet souvent tendance à accorder plus de crédibilité à des sources « classiques » comme la presse ou la littérature scientifique où il y a, en principe, une vérification des informations ou une validation par les pairs qu’à des sources plus « nouvelles » comme les médias sociaux notamment, où n’importe quel internaute peut dire à peu près ce qu’il veut.
La recherche d’information sur le Web en 2019 n’est pas une sinécure et rester à jour sur cette question est un véritable challenge. Ce que l’on croyait acquis il y a 6 mois peut être balayé d’un simple coup de vent, car les méthodes et outils évoluent, changent et disparaissent plus vite que jamais.
Il faut sans cesse se remettre en question, s’informer, se former.
Lire aussi :
Tracer ses recherches pour gagner en expertise et en productivité
Trois nouveaux outils de recherche au banc d’essai
La recherche d’information par géolocalisation
Quand on effectue des recherches d’information dans un cadre professionnel, il ne subsiste bien souvent que le livrable final qui ne contient que les informations jugées pertinentes à un instant T pour un sujet donné. Ce livrable est généralement conservé, archivé et on peut dans ce cas le retrouver et effectuer des recherches sur son contenu si besoin est.
Mais la recherche représente bien plus que cela et ne peut se limiter à ce document final et ce qu’il contient : en amont, il y a différentes requêtes testées sur différents outils de recherche, des sites et pages Web visités, des informations et sources mises de côté, d’autres éliminées, une navigation de site en site, de page en page ou de document en document, etc.
Il est de plus en plus rare de garder des traces précises, détaillées et structurées de tout le cheminement de la recherche. Cheminement qui est d’ailleurs de moins en moins linéaire et de plus en plus « brouillon » ou, du moins, qui fonctionne de plus en plus par tests et investigations successives. Il y a bien eu une époque où les stratégies et résultats de recherche étaient sauvegardés et capitalisés dans des bases de données internes. Mais personne n’y allait jamais et ces projets ont généralement été abandonnés.
Lire aussi :
Rechercher différemment - Dossier Spécial
Trois nouveaux outils de recherche au banc d’essai
La recherche d’information par géolocalisation
Si la recherche d’information actuelle reste grandement tributaire des mots-clés, il existe d’autres méthodes plus ou moins nouvelles pour faire ressortir des informations utiles et complémentaires : recherche par l’image grâce à des outils de recherche inversée, recherche de logo dans des images ou vidéos, recherche à partir d’une URL ou encore recommandations de contenus à partir des autres contenus visualisés par les utilisateurs, etc.
Il en existe une autre, liée à l’avènement des médias sociaux que l’on pourrait qualifier de recherche par géolocalisation, que nous n’avions pas encore eu l’occasion d’aborder dans le détail. L’idée est ici de récupérer et retrouver tous les contenus publiés à un endroit précis grâce aux coordonnées géographiques (latitude et longitude) et données GPS souvent associés aux contenus.
Lire aussi :
Rechercher différemment - Dossier Spécial
Trois nouveaux outils de recherche au banc d’essai
Tracer ses recherches pour gagner en expertise et en productivité
Pour interroger le Web visible, les professionnels de l’information continuent d’utiliser principalement Google, tout simplement parce que la pertinence des résultats reste bien supérieure à celles de ses concurrents.
La majorité des alternatives apparues au cours des dernières années se concentrent sur le respect de la vie privée à l’image de Qwant, DuckDuckGo, Ecosia, etc. Et malheureusement pour les professionnels de l’information, aussi intéressant que cela puisse être, cela n’améliore en rien la qualité et la pertinence des résultats. C’est même plutôt l’inverse...
Mais Google de son côté, même s’il reste meilleur, change très rapidement et ne cesse de se dégrader du point de vue de la recherche d’information professionnelle. Il faut bien l’admettre, nous ne sommes pas et ne serons jamais son public cible !
Il est donc crucial de continuer à chercher des alternatives ou du moins des compléments à nos outils actuels et notamment Google pour interroger le Web de surface, mais aussi accéder au Web profond.
Sur ce sujet, la France n’est pas la plus mal lotie avec de nouveaux outils venant se positionner sur de nouvelles façons de rechercher de l’information. Au cours des derniers mois, nous en avons repéré trois nouveaux, très différents dans leurs approches, stratégies et modèles économiques : Geotrend, Needle, Netguide.
Lire aussi :
Rechercher différemment - Dossier Spécial
La recherche d’information par géolocalisation
Tracer ses recherches pour gagner en expertise et en productivité
Lors de la dernière édition d’i-expo en mars dernier, une table ronde a rassemblé un panel d’experts représentant toutes les facettes du secteur de l’information.
Étaient présents :
Frédéric Martinet, consultant et formateur en intelligence économique, et créateur du blog Actulligence
Véronique Mesguich, consultante et formatrice, auteur de l’ouvrage « Rechercher l’information stratégique sur le web : sourcing, veille et analyse à l’heure de la révolution numérique », (DeBoeck, 2018, collection «Information et stratégie»).
Qui n’a jamais rêvé d’un outil de recherche ou de veille unique, multi sources et multi contenus qui, à partir d’une seule requête, fournirait l’intégralité des résultats utiles et pertinents sur un sujet donné ?
Si cette question occupe les outils de recherche et éditeurs de veille depuis des décennies, force est de constater que la possibilité de rechercher en un seul et même endroit sur des contenus toujours plus nombreux et disparates reste un idéal vers lequel la plupart cherchent toujours à tendre.
Lire aussi :
Google ajoute deux nouveaux opérateurs de recherche
Quand peut-on clore sa recherche l'esprit tranquille ?
Search Lab : 3 méthodologies clé en main
Comment détecter des innovations de marché ?
La recherche d information appliquée aux personnes
LinkedIn est un outil de recherche puissant pour tout ce qui a trait à la recherche sur les personnes mais également depuis peu pour le contenu.
Irina Shamaeva, auteur du blog https://booleanstrings.com spécialisé dans la recherche d’information et le sourcing appliqué aux ressources humaines et au recrutement, a publié un intéressant récapitulatif des opérateurs de recherche existants sur LinkedIn, parmi lesquels certains fonctionnent mais ne sont même pas documentés par LinkedIn (voir figure 1 - Pour abonnés uniquement).
Google vient d’annoncer le lancement de deux nouveaux opérateurs de recherche liés à la recherche par date.
Il s’agit de des opérateurs before:AAAA-MM-JJ
ou before:AAAA/MM/JJ
et after:AAAA-MM-JJ
ou after:AAAA/MM/JJ
pour rechercher des résultats publiés avant ou après une certaine date.
Par exemple, after:2019-04-02
permet de limiter aux résultats publiés après le 2 avril 2019.
On peut également utiliser la syntaxe before:AAAA
et after:AAAA
et le moteur recherchera alors tout ce qui a été publié après le 1er janvier de l’année en question.
Cette fonctionnalité très utile, même si les dates de publication estimées par Google ne sont pas toujours parfaitement exactes, existe dans les filtres de Google depuis de nombreuses années. On peut en effet se rendre dans l’onglet Outil puis Date et choisir « moins d’1h », « moins de 24h », « moins d’une semaine », « moins d’1 mois », « moins d’un an » ou « période personnalisée ».
Lire aussi :
Presse, réseaux sociaux, contenus multimédia, littérature scientifique, données, etc. : rechercher sur des contenus très disparates
Quand peut-on clore sa recherche l'esprit tranquille ?
Search Lab : 3 méthodologies clé en main
Comment détecter des innovations de marché ?
La recherche d information appliquée aux personnes
Il est plus que jamais indispensable de se former en continu à ses problématiques métiers et de réaliser sa propre veille sur la veille pour rester un expert. Car le monde de l’information change de plus en plus vite.
Mais suivre l’actualité des acteurs et outils de la veille et de la recherche d’information est de plus en plus chronophage et souvent difficile à intégrer à ses tâches du quotidien...
Pour cette raison, nous avons décidé de consacrer désormais deux pages de chaque numéro de NETSOURCES à cette veille métier avec :
Lire aussi :
L’évolution de la frontière gratuit/payant impacte la veille stratégique et technologique
Quand les outils de veille intègrent les contenus payants à leurs offres
Retour sur le Challenge de la veille 2019
La recherche d’information est au cœur des métiers de l’information depuis toujours et on a parfois le sentiment de tout savoir à son sujet. Mais la recherche d’information telle qu’elle était pratiquée il y a plus de 30 ans (lors du lancement de BASES par exemple) n’a plus grand chose à voir avec celle que nous pratiquons aujourd’hui. Elle se transforme d’ailleurs plus vite que jamais...
D’un côté, rechercher de l’information n’a jamais eu l’air aussi simple et accessible. On dispose en effet de nombreux outils gratuits proposant des interfaces intuitives et que l’on peut interroger en langage naturel.
Mais de l’autre, nous vivons aujourd’hui dans un monde avec une surabondance de sources, outils, méthodes et informations.
La recherche d’information n’a en réalité peut-être jamais été aussi complexe et multiple.
Lire aussi :
Un regain d’énergie et de vitalité pour les outils de recherche
Bien interroger les outils de recherche gratuits : une multitude de méthodes
Si, comme nous avons pu le voir, le paysage des outils de recherche a évolué, c’est également la façon de les interroger qui a beaucoup changé en quelques années.
Au départ, tous les outils ou presque proposaient au minimum une recherche booléenne simple.
Par recherche booléenne, nous faisons référence ici à des requêtes structurées plus ou moins longues où l’on combine des mots-clés grâce aux opérateurs booléens classiques AND, OR, NOT mais aussi des opérateurs avancés (opérateur de proximité, recherche dans le titre, recherche sur un type de fichier, troncature, etc.).
Lire aussi :
Un regain d’énergie et de vitalité pour les outils de recherche
Google évolue, les documentalistes plus utiles que jamais
Comment bien interroger Google en 2018
L'information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ?