L’intelligence artificielle s’invite dans le quotidien des professionnels de l’information. Lancée en tant que prototype le 30 novembre 2022, ChatGPT https://openai.com/blog/chatgpt s’est imposé comme l’application connaissant la croissance la plus rapide de tous les temps. Parallèlement, les enregistrements de noms de domaine en .ai ont augmenté de 156% au cours de la dernière année, contre seulement 27% pour les domaines en .com au cours de la même période, selon Domain Name Stat.
Selon l’OCDE, 14 % des emplois seront ainsi exposés à un enjeu majeur d’automatisation, tandis que 32 % des emplois pourraient être transformés substantiellement. Qu’en est-il pour les professionnels de la veille ?
Face à cette ascension fulgurante, il reste difficile d’appréhender son nouvel environnement. Nous nous proposons donc de partager les bases de fonctionnement d’un système IA utiles aux métiers de la veille et de la recherche d’information et d’esquisser, à chaque étape du processus de veille, les premiers bouleversements expérimentés.
Le professionnel de la veille, parce qu’il manipule l’information qui transite entre l’intelligence humaine et l’intelligence artificielle, doit ainsi apprendre de nouveaux modèles de langage et d’apprentissage : ceux utilisés par l’IA.
Lire aussi :
Comment l’IA enrichit les livrables de veille multilingue ? (04/2023)
Revue des moteurs de recherche à l’heure de ChatGPT (04/2023)
Quels outils utiliser pour bénéficier de ChatGPT ? (01/2023)
Détecter un contenu écrit par ChatGPT : IA face à l’IA (gratuit - 02/2023)
Notre sélection d’annuaires d'outils IA (article en accès libre)
Le bouleversement de ce début d’année 2023, c’est bien évidemment le lancement grand public de ChatGPT et plus largement la course à l’intégration de l’IA générative dans tous les outils du quotidien et du monde professionnel.
Les moteurs de recherche Web dans leur ensemble se sont tous précipités pour intégrer cette dimension à leurs moteurs, certains intégrant directement GPT-3 ou 4 comme Bing et d’autres préférant utiliser d’autres modèles.
Cette intégration de l’IA générative et conversationnelle dans les moteurs apporte sans conteste une dimension nouvelle à la recherche d’information sur le Web.
Mais est-ce que cela améliore réellement les moteurs Web ? Cela permet-il de trouver plus rapidement de l’information, de trouver des informations qui n’arrivaient pas à émerger dans les moteurs de recherche, d’explorer plus en profondeur la fameuse longue traîne ?
Lire aussi :
Les moteurs gratuits, c’est fini
L’actu du Veilleur : plein phare sur l’IA
Quels outils utiliser pour bénéficier de ChatGPT ?
Nous avons testé Kagi Search, un nouveau challenger de Google
Presearch permet de chercher depuis la localisation de son choix
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.
Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable (https://airtable.com/). Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.
Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.
Le nouveau moteur de recherche Kagi Search travaille actuellement sur un nouveau projet de recherche baptisé « Mother ».
Lorsqu’on pose une question à Mother, une IA de recherche sur le web « user-centric », « maman » ne se contente pas de fournir une liste de sources, mais en fait le résumé automatique.
Si on lui demande par exemple de comparer le nombre d’habitants entre deux villes, elle fournira directement une réponse synthétique issue de plusieurs sources, et non une liste de sources où aller chercher. Elle répond aussi à des questions comme « Pourquoi la terre est ronde ? ».
L’heure est indéniablement aux bonnes nouvelles du côté des moteurs. Alors qu’il n’y avait jusqu’à présent aucune alternative crédible à Google sur le terrain des moteurs Web pour la veille et la recherche d’information professionnelle, on voit enfin arriver sur le marché une nouvelle génération de moteurs en phase avec les problématiques des professionnels de l’information.
Après le lancement du très prometteur Neeva (voir notre article « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » - BASES n°406 - septembre 2022) voici venir un autre moteur tout aussi intéressant appelé Kagi Search (https://kagi.com/).
Kagi a lui aussi opté pour un positionnement où la qualité des résultats et de la recherche et le respect de la vie privée priment. Et ce choix passe également par un modèle économique freemium.
Dans cet article, nous présentons en détail ce nouveau moteur, son positionnement et ses fonctionnalités et nous évaluons sa capacité à intégrer la panoplie des veilleurs et des professionnels de l’information.
Lire aussi :
Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info
Utiliser la fonctionnalité Goggles de Brave Search en complément de Google CSE
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Cela fait 20 ans que de nouveaux moteurs apparaissent avec pour ambition de concurrencer voire détrôner Google. Et pratiquement tous ont le même créneau : le respect de la vie privée, domaine où il est clair que Google n’excelle pas.
Quand on recherche de l’information dans un contexte professionnel, le respect de la vie privée est certes important, mais il faut aussi pouvoir obtenir des résultats pertinents et de qualité et avoir à disposition des fonctionnalités de recherche dignes de ce nom. Et c’est malheureusement rarement le cas des différents moteurs que nous avons pu tester ces dernières années tels que Qwant, DuckDuckGo, Yep.com ou encore You.
Un nouvel entrant pourrait bien venir changer les règles du jeu dans le monde des moteurs grâce à sa bonne compréhension des requêtes et la qualité de ses résultats.
Il s’agit du moteur Neeva qui arrive enfin en Europe après avoir été lancé aux États-Unis en 2021. Et le moins que l’on puisse dire, c’est que ce moteur a de très nombreuses qualités, allant de la longue expérience de ses fondateurs chez Google à des fonctionnalités qui servent vraiment les professionnels de l’information.
Le moteur Brave fait partie des moteurs prometteurs à avoir dans sa boîte à outils de recherche.
Il a récemment introduit une fonctionnalité intéressante appelée « Goggles », permettant à tout internaute de créer un moteur pour rechercher sur des corpus de sources personnalisés.
Les moteurs personnalisés sont une véritable aubaine pour les professionnels de l’information et de la veille et on note d’ailleurs un regain d’intérêt pour ces outils, comme en témoigne le lancement de cette fonctionnalité chez Brave, les possibilités de personnalisation chez Neeva ou encore le lancement de l’Atlas.pro
Voir nos articles « Nous avons testé Neeva, le moteur qui pourrait remplacer Google chez les pros de l’info » et « Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable », BASES n° 402, avril 2022.
Tous ces outils et fonctionnalités ne sont d’ailleurs pas sans rappeler le moteur personnalisé proposé par Google appelé Google CSE, qui existe toujours et qui vient d’ailleurs de rajeunir son interface. Créer un moteur personnalisé sur Brave n’est malheureusement pas aussi simple que la création du moteur CSE sur Google, mais ce n’est pas insurmontable.
Dans cet article, nous vous expliquons pas à pas comment créer vos propres corpus de recherche sur Brave et nous évaluons la valeur ajoutée de ces moteurs personnalisés par rapport à Google CSE.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Nous avons testé Yep.com, un nouveau moteur de recherche à l’index maison
Nous avons testé Latlas.pro, un nouveau moteur de recherche thématique personnalisable
Faut-il préférer l’opérateur site: de Google ou la création d’un moteur CSE ?
L’entreprise spécialisée dans le SEO Ahrefs, basée à Singapour, mais fondée par l’Ukrainien Dmytro Gerasymenko, vient de dévoiler son propre moteur de recherche, Yep.com, qui se veut un émule du moteur Brave et ambitionne de prendre quelque part de marché au mastodonte Google et, dans une moindre mesure, à Bing.
À la différence des moteurs tels qu’Ecosia et DuckDuckGo, Yep.com dit utiliser pour son moteur un index développé en interne, à l’instar de Brave Search (voir notre article « Brave Search, You et Presearch : les nouveaux moteurs passés au crible », BASES n° 397 de novembre 2021), et non sur des API dérivant ou s’appuyant sur les index de Google et Bing.
L’index s’appuie donc pour l’instant sur AhrefsBot, un crawler « fait maison » pour indexer le Web, au rythme de 8 milliards de pages web toutes les 24 heures, selon la société.
La prochaine étape prévue sera de créer un YepBot indépendant des algorithmes d’Ahrefs.
Lire aussi :
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Alors que ces dernières années, l’interface de Google Actualités n’avait pratiquement plus aucun un intérêt pour la veille et la recherche et qu’il valait mieux passer par l’onglet « Actualités » du moteur web de Google, Google Actualités (ou Google News) a récemment introduit des fonctionnalités inédites.
Plusieurs d’entre elles découlent d’une utilisation accrue de l’IA et sont particulièrement prometteuses pour la veille et la recherche d’information, à tel point qu’elles pourraient bien amener le professionnel de l’info à reconsidérer l’interface pour ses recherches, en plus du moteur web classique.
Google Actualités a récemment lancé une nouvelle interface pour Google Actualités. Cette nouvelle version reste dans la droite ligne des dernières évolutions de Google sur l’ensemble de ses produits et Google cherche à collecter le plus d’informations possible sur le profil et les habitudes de ses usagers.
Google précise d’ailleurs sans détour son parti pris concernant sa politique de contenu dans le court disclaimer suivant :
« Ces articles sont classés en fonction de leur qualité, de l’originalité et de l’actualité de leur contenu, de votre activité et de vos achats précédents dans Google Actualités, ainsi que de votre activité dans d’autres produits Google. Google peut avoir un contrat de licence avec certains éditeurs, mais cela n’a aucun impact sur le classement des résultats. »
ArchiRès est le nom d’un réseau de bibliothèques des écoles nationales supérieures d’architecture (ENSA) et du paysage en France, mais également d’instituts en Belgique, au Maroc et au Liban. C’est aussi un portail documentaire du même nom qui donne accès à un catalogue de recherche commun aux différents organismes membres d’Archirès.
Une nouvelle version de ce portail vient de voir le jour le 28 mars dernier.
Nous avons exploré pour vous cette ressource et évalué son intérêt pour la veille et la recherche d’information.
Lire aussi :
Zoom sur les ressources de l’AURG pour l’urbanisme et l’aménagement
Zoom sur le portail de l’INRS sur la santé et sécurité au travail
Zoom sur Cerema Doc, la plateforme documentaire du climat et territoires de demain
Zoom sur le portail documentaire Eau & Biodiversité
Même bien avant l’invention du Web, il a toujours existé un besoin de sources et outils capables de proposer, d’agréger et de structurer des listes de personnes, d’entreprises, de sources, etc. qualifiées par rapport à une thématique donnée ou un type de contenus. C’est le principe même des annuaires, dont on retrouve les premières traces dès le Moyen-âge.
Et ces annuaires et répertoires, papier d’abord puis numériques (on se souvient de l’annuaire de Yahoo ou de Dmoz) ont toujours été d’une grande utilité pour le veilleur et ont longtemps fait partie de la panoplie de base du professionnel de l’information. Ils constituaient en quelque sorte de riches portails agrégateurs de flux thématiques.
Pourtant, ils se sont fait de plus en plus discrets avec les années, quitte à disparaître pour un grand nombre d’entre eux ou ont simplement été délaissés par les internautes et les professionnels.
Les moteurs de recherche généralistes comme Google, Bing et les autres ne sont pas sans responsabilité dans leur disparition. D’un côté les moteurs eux-mêmes ont tout fait pour marginaliser ces acteurs en limitant leur visibilité dans les résultats de leur propre moteur. Et de l’autre, les internautes ont naturellement choisi la voie de la simplicité et de l’efficacité en choisissant des outils les menant directement à la réponse à leur question plutôt que des outils les conduisant vers des sources pertinentes qu’il faut ensuite explorer et interroger.
Mais le vent pourrait bien être en train de tourner…
Lire aussi :
Comment identifier des sources d’information locales ?
Comment trouver des outils de recherche d’information thématiques ?
Comme nous l’avons vu dans l’article « La veille Web sans trace : un pari impossible ? », laisser le moins de traces possible lors de ses recherches et veilles sur le Web n’est pas chose facile.
Et pourtant, il existe des cas où cette stratégie est intéressante, voire même indispensable. On pensera ainsi aux cas où il faut limiter les biais liés à la personnalisation des résultats, et aux cas où il faut éviter de trop se dévoiler dans le cadre de sujets stratégiques, concurrentiels ou confidentiels.
Alors, comment s’y prendre ?
Dans cet article, nous analysons les différentes possibilités, méthodes et outils existants aujourd’hui. Nous couvrons un large champ de solutions allant de la plus simple et rapide à la plus complexe et chronophage. Pour chacune d’entre elles, nous évaluons les cas concrets où elles peuvent avoir une utilité et quels sont les avantages et inconvénients pour le processus de veille et de recherche d’information en lui-même.
Lire aussi :
Optimiser sa veille avec des extensions Chrome ou Firefox
Brave Search, You et Presearch : les nouveaux moteurs passés au crible
Depuis quelques années, le sujet du respect de la vie privée et de l’anonymat sur le Web prend de l’ampleur et les internautes adaptent leurs méthodes pour laisser moins de traces sur le Web. On ne cesse de voir des articles qui nous expliquent comment être le moins visible possible et comment préserver son anonymat.
Les méthodes pour y parvenir sont multiples, allant de conseils simples à implémenter, à des méthodes nettement plus chronophages et compliquées : de l’utilisation de moteurs plus respectueux de la vie privée à l’utilisation de VPN, installation de TOR, etc.
Si la question se pose de manière bien réelle dans le cadre de sa vie privée, qu’en est-il dans un contexte professionnel de recherche d’information et de veille ? Qu’a-t-on à gagner à laisser peu ou pas de traces sur le Web ou bien qu’a-t-on à y perdre ? Faut-il adapter ses méthodes de veille et de recherche d’information et en faire une démarche systématique ou bien l’utiliser dans certains cas bien précis ?
C’est ce que nous avons analysé dans ce nouveau numéro de NETSOURCES.
Lire aussi :
Google et la « recherche personnalisée » : quel impact pour les professionnels de l’information ?
Le Web change à vive allure et les sites Web que l’on voit aujourd’hui n’ont plus grand-chose à voir avec ceux d’il y a 5, 10 ou 20 ans. Si cette évolution est bien normale, elle pose un important problème en termes de conservation des données : tous les contenus qui se trouvaient sur ces sites qui ont disparu sont aujourd’hui inaccessibles directement sur le Web ou les moteurs. Et il n’existe que peu de moyens pour les retrouver.
Pour le professionnel à la recherche de contenus anciens (même s’il ne s’agit que de remonter quelques années en arrière), cette quête peut vite devenir compliquée, voire même perdue d’avance.
On a d’un côté les médias qui conservent dans la plupart des cas leurs archives Web. Ainsi une recherche d’antériorité sur ces contenus reste relativement simple. Les médias sociaux quant à eux conservent l’ensemble des contenus (sauf ceux supprimés volontairement par l’utilisateur), comme Twitter par exemple qui permet de rechercher jusqu’en 2006, année de son lancement. Là aussi, une recherche d’antériorité ne pose pas de problème majeur.
Mais pour de nombreux autres sites comme les sites d’entreprises, les sites institutionnels, les sites personnels, il ne subsiste rien quand le site fait peau neuve ou disparaît.
Lire aussi :
Comment retrouver de vieux articles de presse ?
Conseil Veille du 12 mai 2021 pour naviguer dans les archives d’un site web
Outils de recherche sur les contenus audios : un segment encore pauvre
Tout le monde ou presque utilise Google pour rechercher de l’information. S’y limiter présente néanmoins quelques risques : l’un des plus importants étant de passer à côté de contenus pertinents non accessibles sur le Web ouvert ou mal référencés.
Pour mener une recherche efficace sur Google, on peut bien évidemment tirer parti des différentes fonctionnalités proposées par le moteur (recherche sur un site ou une extension précise, recherche sur certains types de fichiers, recherche sur les titres de pages, etc).
Les fonctionnalités sont toujours nombreuses mais certaines ont disparu ces dernières années et d'autres n’ont tout simplement jamais fonctionné correctement (comme l’opérateur de proximité AROUND par exemple).
Mais saviez-vous que certains concurrents de Google comme Bing, DuckDuckGo ou encore Yandex proposent quelques fonctionnalités originales ou innovantes que l’on ne retrouve pas chez le géant américain ?
La phase de sourcing, c’est-à-dire l’identification des sources d’informations pertinentes est un élément essentiel de tout processus de veille. On peut bien évidemment créer des alertes sur des moteurs, réseaux sociaux, agrégateurs de presse tous azimuts ce qui peut générer un bruit considérable mais on a aussi et surtout intérêt à identifier et mettre sous surveillance des sources précises en lien avec son sujet.
Différentes méthodes sont possibles pour y parvenir : interroger des moteurs de recherche, des médias sociaux en testant plusieurs stratégies de recherche plus ou moins ciblées, explorer des sites de référence à la recherche d’une rubrique « liens » qui redirigerait vers d’autres sites pertinents, etc.
Le marché des moteurs de recherche «à modération humaine », comme les qualifie Phil Bradley sur son blog orienté internet & médias sociaux, n’en finit pas de mourir et de se régénérer. La disparition du moteur ChaCha coïncide avec l’arrivée d’Askwonder. Les interfaces et les business models varient mais ces moteurs reposent tous sur un même principe : le client sous-traite sa recherche d’informations (sur tous sujets) à une armée d’experts distants via un site web.
A priori effrayants, - on pense à tous les emplois détruits des vrais professionnels de l’information, remplacés par des cohortes de chercheurs incertains et surtout invisibles, - ces moteurs, de par cette perpétuelle renaissance, sont intéressants à plus d’un titre.
Ils sont d’abord la preuve vivante que les moteurs de type Google n’ont pas remplacé le besoin d’expertise et de médiation humaine face à l’outil. Même pratiquée dans des conditions dégradées, l’intervention humaine demeure nécessaire et elle est ici toujours reconnue et fortement valorisée, puisque ces moteurs se lancent à coût d’investissements importants.
Pour interroger la presse que ce soit pour la France ou à l’étranger, on pense généralement aux solutions suivantes :
Mais ces différentes solutions ne permettent malheureusement pas d’accéder à une très grande antériorité notamment au delà des années 90. Alors, comment faire ?
Google est le leader incontesté des moteurs de recherche et on a du mal à voir qui pourrait le détrôner un jour.
Pourtant, régulièrement, on voit surgir de nouvelles initiatives, notamment en France, de moteurs de recherche dits "révolutionnaires" et "innovants".
Ces nouveaux moteurs peuvent-ils avoir un intérêt pour la veille ou la recherche d’information ?
Pour le moment, aucun, malheureusement, n’a réussi à renverser la tendance.
Alors qu’à ses débuts Google était un moteur de recherche qui se limitait exclusivement aux mots-clés entrés par les internautes, la recherche sémantique prend aujourd’hui une part de plus en plus prépondérante dans le fonctionnement de Google.
Ces évolutions représentent un changement important pour tous les professionnels de l’information et de la veille qui n’ont plus nécessairement besoin d’entrer une longue requête avec les différentes formes d’un mot et synonymes puisque le moteur élargit en principe automatiquement la recherche à ses différentes variantes.
Nous avions d’ailleurs eu l’occasion d’aborder en détail cette question dans un article de Bases intitulé : « la mort annoncée de la recherche booléenne » (Bases n°340 – septembre 2016) où l’on découvrait d’ailleurs que les longues requêtes booléennes sur Google pouvaient en réalité avoir l’effet inverse à celui escompté.
Les salons professionnels représentent souvent une source d’information intéressante pour la veille et la recherche d’information.
Cela permettra par exemple :
d’identifier des salons en lien avec son activité pour y devenir exposant ou simple visiteur
de traquer la présence de concurrents sur les salons dans le cadre d’une veille concurrentielle
de repérer des fournisseurs et partenaires éventuels
d’identifier des médias spécialisés sur une thématique précise dans le cadre d’un sourcing
de repérer de nouveaux acteurs, start-ups et produits et services innovants dans un secteur bien précis pour une veille innovation, etc…
La semaine dernière, nous avions consacré un billet à la stratégie de Bing par rapport à Google : « La guerre Bing versus Google : Bing contre-attaque sur de nouveaux terrains » .
Dans cet article nous mentionnions Bing Custom Search, un moteur de recherche personnalisable lancé par Microsoft il y a quelques mois, qui n’est ni plus ni moins qu’un concurrent direct de Google CSE.
Les moteurs personnalisables représentent un intérêt indéniable pour la veille et la recherche d’information. Mais maintenant qu’il existe une alternative a priori crédible à Google CSE, lequel est le plus performant et dans quels cas choisir l’un plutôt que l’autre ? C’est ce que nous avons cherché à savoir cette semaine en comparant les deux services.
Depuis maintenant quelques années, Google propose sur la première page de résultats et, pour certaines requêtes seulement, des featured snippets, appelés en français extraits optimisés même si le terme français est beaucoup moins utilisé.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », il constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
Ainsi, si vous demandez à Google « qu’est-ce que la veille stratégique ? », un encadré apparaît au dessus des résultats naturels contenant une définition de la veille stratégique issue de la page Wikipédia du même nom. Il n’est ainsi même pas nécessaire de se rendre sur cette page Web pour avoir la réponse à sa question. Du moins, en principe...
Est-ce que ces résultats apporte une réelle valeur ajoutée et un gain de temps pour la recherche d’information ou bien au contraire représentent-ils un pas de plus vers la mort des moteurs de recherche et l’avènement de l’ère de l’assistance ?
Les concepts d’études de marché et de gratuité semblent à première vue antinomiques. Les études de marché ont la réputation d’être chères, très chères même...
Alors que se cache t-il derrière ces sites et organismes qui proposent des études de marché gratuites ou très bon marché ? Quel intérêt ces documents peuvent-ils avoir pour la veille et la recherche d’information ?
Derrière le terme « étude de marché » se cachent en réalité de multiples définitions.
Certains lui appliquent une définition très stricte : celle d’une étude longue combinant de manière équilibrée données sectorielles et vision stratégique et prospective d’un marché.
D’autres, au contraire, englobent toute forme de rapports ou d’études courtes ou longues incluant des données de marché.
Et les documents que l’on trouve gratuitement sur le Web relèvent principalement de cette seconde définition.
Depuis plus de 10 ans maintenant, Google a recours à ce qu’il appelle la « recherche personnalisée ».
Concrètement, cela signifie que Google personnalise la liste des résultats naturels de ses utilisateurs en fonction de différents critères : localisation, historique de recherche, historique de navigation ou encore présence et contacts sur les médias sociaux, etc.
Deux personnes effectuant une même requête au même moment n’ont donc pas nécessairement les mêmes résultats.
Et quand on sait que Google n’affiche en réalité pas plus de 200/300 résultats au maximum par requête, même s’il indique à première vue des milliers voire des millions de réponses, on risque vite de passer à côté d’informations et de sources pertinentes...
Lire aussi :
Google évolue, les documentalistes plus utiles que jamais ?
Toute recherche d’information débute généralement par une recherche sur un moteur de recherche web généraliste et bien souvent Google.
Comme nous avons pu le voir dans le dernier numéro de NETSOURCES n°154 (septembre/octobre 2021), Google est de plus en plus un assistant virtuel, très bon certes, qui sélectionne des informations qu’il va présenter à l’utilisateur. Et en faisant cela, il s’éloigne de plus en plus de l’exhaustivité que l’on peut chercher à atteindre dans le cadre de certaines recherches d’informations.
C’est pour cela qu’il est plus que jamais utile d’aller interroger d’autres moteurs qui pourront faire émerger des résultats différents et complémentaires.
Ces dernières années, plus aucun acteur n’essayait véritablement de concurrencer directement Google, à l’exception de Bing qui gardait malgré tout toujours un train de retard. Les nouveaux acteurs, souvent des métamoteurs, faisaient tous le choix de se positionner sur des créneaux différents de ceux de Google : moteur qui respecte la vie privée comme Qwant ou DuckDuckGo, moteur qui aide à la sauvegarde de la planète comme Ecosia ou encore Lilo, moteurs thématiques, etc.
Lire aussi :
Google n’est plus un moteur de recherche ni de réponses, mais un assistant virtuel
Le professionnel de l’info face à un Google en perpétuel mouvement
Comment utiliser Google pour des questions complexes ? Restez simple !
Comment trouver des outils de recherche d’information thématiques ?
Comment construire ses propres outils de recherche d’information thématiques ?
La société Aleph Networks, pionnière dans la cybersécurité sur le Dark Web, était présente sur le salon I-Expo/Documation 2020. A cette occasion, elle présentait son nouveau produit en cours de lancement « Aleph Search Clear » qui s’adresse à un tout nouveau public, celui de la veille concurrentielle ou stratégique et s’attaque pour le coup à un nouvel environnement Web bien connu des veilleurs : le Clear Web.
Le Dark Web et le Deep Web sont des espaces très instables qui tendent à ajouter ou retirer fréquemment des sites. Ils suscitent bon nombre de rumeurs et il est par conséquent important de démystifier les différents volets qui composent le Web.
Voir aussi :
ORCID et les autres outils d’identification des auteurs de publications scientifiques
Plateformes de veille : qu’ont-elles à offrir aux PME et TPE ?
La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.
On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.
Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).
Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…
Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.
En cette période particulière, l’actualité de la veille et de la recherche d’information est très différente du paysage habituel. Une majorité des actualités et informations traitent des ressources d’information autour du coronavirus, la gratuité temporaire de certains outils et sources d’information ainsi que du thème du télétravail.