Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Tracer ses recherches pour gagner en expertise et en productivité - Dossier spécial Rechercher différemment

Netsources no
142
publié en
2019.09
1170
Tracer ses recherches pour gagner en expertise et en ... Image 1
Tracer ses recherches pour gagner en expertise et en ... Image 1

Quand on effectue des recherches d’information dans un cadre professionnel, il ne subsiste bien souvent que le livrable final qui ne contient que les informations jugées pertinentes à un instant T pour un sujet donné. Ce livrable est généralement conservé, archivé et on peut dans ce cas le retrouver et effectuer des recherches sur son contenu si besoin est.

Mais la recherche représente bien plus que cela et ne peut se limiter à ce document final et ce qu’il contient : en amont, il y a différentes requêtes testées sur différents outils de recherche, des sites et pages Web visités, des informations et sources mises de côté, d’autres éliminées, une navigation de site en site, de page en page ou de document en document, etc.

Il est de plus en plus rare de garder des traces précises, détaillées et structurées de tout le cheminement de la recherche. Cheminement qui est d’ailleurs de moins en moins linéaire et de plus en plus « brouillon » ou, du moins, qui fonctionne de plus en plus par tests et investigations successives. Il y a bien eu une époque où les stratégies et résultats de recherche étaient sauvegardés et capitalisés dans des bases de données internes. Mais personne n’y allait jamais et ces projets ont généralement été abandonnés.

La problématique et les difficultés rencontrées pour remonter le fil de ses recherches antérieures n’ont pas pour autant disparu.

Lire aussi : 

Rechercher différemment - Dossier Spécial
Trois nouveaux outils de recherche au banc d’essai
La recherche d’information par géolocalisation


Des semaines, mois ou années plus tard, il est fréquent d’avoir besoin de remettre la main sur certains de ces sites, pages et documents. On se souvient d’avoir déjà vu cette information quelque-part, d’avoir déjà identifié une source sur ce sujet, mais on a beau tester plusieurs requêtes sur Google, explorer des sites que nous pensions être les bons, impossible de remettre la main dessus. Cela prend parfois un temps considérable pour y parvenir et dans certains cas, cette recherche s’avère même vaine, car le site ou la page a tout simplement disparu.

Dans un contexte de veille, il peut être également intéressant de pouvoir utiliser son historique de recherche et de navigation :

  • pour reproduire son cheminement lors de recherches récurrentes qui, pour différentes raisons, ne sont pas automatisables ;
  • pour vérifier si on a déjà consulté un article, une page ou un document et ainsi éviter de la transmettre à nouveau.

Effectuer des recherches d’information sur le Web au présent est une chose, mais revenir sur des recherches antérieures en est une autre. Et cela peut vite se transformer en chasse au trésor !

Dans cet article, nous avons choisi d’explorer les méthodes et solutions aujourd’hui disponibles pour remonter le fil de ses stratégies de recherche d’une part (mots-clés utilisés, requêtes précises) et de sa navigation sur le Web (pages visualisées, sites consultés, documents ouverts).

Nous verrons tout d’abord à travers différents exemples méthodologiques comment il est possible de remonter sur les traces de ses recherches et navigations antérieures.

Nous dresserons ensuite un panorama des outils utiles pour tracer ses requêtes et navigations, qu’il s’agisse de solu­tions manuelles ou automatiques.

Remonter sur les traces de ses recherches et navigations antérieures : quelles méthodes ?

Historiques des moteurs et navigateurs: comment en tirer parti et quelles sont leurs limites ?

Quand on pense historique de recherche, on pense en premier lieu à son historique de navigateur ou de moteur de recherche.

En effet quand nous effectuons des recherches sur des moteurs et quand nous naviguons sur le Web, nous laissons des traces plus ou moins importantes de notre passage :

  • le navigateur (Firefox, Chrome, Edge, etc.) conserve un historique de notre navigation ;
  • certains moteurs et notamment Google conservent un historique des recherches effectuées, services Google utilisés et sites et pages visitées depuis Google ;

Utiliser et rechercher dans ces historiques serait donc a priori la meilleure manière de retrouver des informations, pages ou documents déjà consultés par le passé.

Sauf que c’est loin d’être aussi simple....

Tout d’abord, l’historique n’est pas toujours conservé éternellement ou du moins accessible éternellement.

De plus en plus d’internautes effacent régulièrement leur historique que ce soit sur leur navigateur ou directement dans l’historique Google. D’ailleurs, ce souci croissant de respect de la vie privée a conduit ces dernières années la plupart des grands acteurs de Web à devoir simplifier les processus pour effacer les traces de navigation. Google, Facebook, Twitter, Instagram et les autres communiquent aujourd’hui plus régulièrement sur les possibilités offertes aux internautes pour supprimer tout ou partie de leur historique. En juin dernier, Google a même lancé une option permettant aux internautes de paramétrer une suppression automatique de leur historique.

Certains moteurs de recherche, positionnés sur le créneau du respect de la vie privée comme Qwant, DuckDuckGo, etc. ne gardent pas de traces de la navigation et de la recherche de l’internaute rendant donc impossible toute recherche sur son historique.

Et si on utilise les modes de navigation privée proposés par les navigateurs, là encore, l’internaute n’accède pas à son historique. Ce qui ne veut pas pour autant dire que le navigateur ne collecte jamais aucune donnée sur l’utilisateur.

Et même quand l’historique est bien conservé, les fonctionnalités de recherche proposées par les navigateurs, moteurs, etc. pour rechercher dans son historique sont en réalité assez limitées...

En ce qui concerne l’historique des navigateurs comme Chrome ou Firefox, seuls sont accessibles le titre de la page consultée et l’URL. Le moteur, extrêmement basique, disponible dans son historique ne recherche donc que sur ces deux champs. Autant dire que si on ne souvient pas précisément du ou des bons mots-clés présents dans le titre ou l’URL, on n’a pratiquement aucune chance de retrouver la page en question.

Et pour les sites accessibles avec identifiant et mot de passe comme les bases de données ou agrégateurs de presse par exemple, on dispose d’encore moins d’informations : Quels que soient la page ou l’article consulté, le navigateur n’indique que le nom de la page d’accueil (Factiva par exemple et non le titre de la page ou de l’article consulté) et l’URL est souvent constituée d’une suite de lettres et chiffres qui n’ont aucun sens.

L’historique de recherche proposé par Google a le mérite d’être un peu plus performant, car il recherche sur le texte intégral des pages présentes dans l’historique.

Mais il y a tout de même de nombreuses limites :

  • on n’y accède qu’à condition d’être connecté à un compte Google ;
  • Si le moteur de la page « Mon activité » de Google recherche bien sur le texte intégral, cela ne fonctionne que sur les pages en libre accès sur le Web et il arrive qu’il fasse ressortir des pages qui ne contiennent pas le mot-clé cité ;
  • l’historique de Google ne contient que les requêtes effectuées dans le moteur ou les pages consultés depuis le moteur de Google. Ainsi, si vous accédez à une page d’un site après avoir cliqué sur un résultat Google puis que vous naviguez au sein de ce site, seule la première page sera conservée par Google, les autres n’étant pas liées à l’utilisation de Google.

Au final, les chances de retrouver ses requêtes antérieures et les contenus visualisés en utilisant les historiques de moteurs et de navigateur restent assez minces.

Il va donc falloir se tourner vers d’autres méthodes, qui varient selon la quantité de souvenirs et d’indices que l’on peut avoir : mots-clés très précis, nom de la source, titre d’un contenu, etc.

Il faut aussi avoir conscience que retrouver la trace de ses requêtes et stratégies de recherche est pratiquement mission impossible si on n’a rien sauvegardé manuellement et si la recherche dans son historique ne donne rien. En revanche, retrouver des sites, pages et contenus consultés par le passé a plus de chance d’être couronné de succès.

Serveurs, bases de données et agrégateurs professionnels : un cas à part

Certains serveurs et bases de données professionnelles conservent également un historique des recherches effectuées qu’il est possible de rééxécuter pour des recherches futures. Il est aussi parfois possible de sauvegarder directement dans l’outil des documents jugés pertinents.

Mais la situation est très disparate d’un acteur à l’autre.

  • La majeure partie de ces outils permet de sauvegarder des requêtes, mais il s’agit d’un processus manuel initié par l’utilisateur. De même pour la sauvegarde de documents.
  • Certains proposent automatiquement un historique des recherches effectuées (à l’image de Press’edd, un agrégateur de presse française par exemple), mais la durée de conservation est rarement très longue.

Ce n’est pas si grave, car le corpus de sources change peu (sauf si une source est retirée) et l’algorithme n’effectue pas une sélection implicite de documents pertinents et n’élimine pas par lui-même les documents qu’il juge trop anciens. On a donc de bonnes chances de retrouver facilement un document déjà consulté en relançant une simple recherche dans l’outil.

Méthode 1 : Si l’on vient de fermer involontairement un onglet

Lorsque l’on ouvre plusieurs onglets dans le cadre d’une recherche d’information, il peut arriver qu’on en ferme un par erreur sans bien savoir de quelle page il s’agissait. Il existe alors une astuce simple pour le faire réapparaître sans avoir besoin d’aller explorer son historique ou relancer des recherches.

Il suffit d’appuyer sur «Ctrl» et «Maj» et la lettre «T» en même temps.

Cette astuce ne fonctionne que pour des onglets fermés très récemment.

Méthode 2 : si on se souvient précisément de la source

Si on se souvient précisément de la source où se trouvait l’information ou le document, les chances de succès sont meilleures.

Prenons un exemple : nous avions vu il y a quelques mois un tableau très intéressant comparant les modèles gratuit/freemium des médias en Europe. Mais nous ne l’avions pas conservé ni n’avions sauvegardé l’URL. Le seul souvenir que nous avions était qu’il était issu d’un rapport du Reuters Institute probablement publié en 2018 ou 2019.

On commencera donc par explorer la source en question (en se rendant ici sur le site du Reuters Institute (https://reutersinstitute.politics.ox.ac.uk)). Nous lançons plusieurs requêtes dans leur moteur interne (comme par exemple freemium models in europe). Malheureusement, impossible d’identifier le document en question. Il n’est en effet pas rare que les moteurs internes de sites soient de piètre qualité.

Deuxième possibilité : utiliser l’opéra­teur site: pour rechercher sur Google sur un site spécifique. La requête peut alors prendre la forme suivante : site:https://reutersinstitute.politics.ox.ac.uk freemium models in Europe

Le fameux rapport ressort ici en première position.

Dans le cas où la page Web aurait disparu, on conseillera alors de se tourner vers les outils de recherche dédiés aux archives du Web comme la Wayback Machine notamment. Sur ce sujet, on conseillera la lecture de l’article « L’information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ? » (BASES n°363 - octobre 2018). Mais il faut avoir conscience que c’est un processus souvent laborieux sans garantie de succès, car il est impossible de rechercher par mot-clé.

Méthode 3 : si on se souvient précisément de l’émetteur

Quand l’information vient des médias sociaux (Twitter, LinkedIn, Facebook, etc.) et émanait d’un compte précis dont on se souvient, la méthode est un peu différente.

A titre d’exemple, nous avions le souvenir d’avoir vu passer sur Twitter des informations sur un site proposant des tutoriels et vidéos de recherche documentaire pour les professionnels de santé.

Mais impossible de nous souvenir précisément du nom exact si ce n’est qu’il contenait le mot bib et doc. Une recherche dans Twitter avec ces deux termes n’avait rien donné. Par contre, nous nous souvenions de nom du compte qui avait signalé ce service.

Deux possibilités s’offrent alors :

  • utiliser le moteur interne de Twitter en tirant parti de l’opérateur from: qui permet de rechercher précisément sur un compte : from:@nomdutilisateur bib par exemple. Après consultations de quelques résultats, nous avons rapidement retrouvé le nom du site de tutoriels en l’occurence DocToBib
  • utiliser Google en tirant parti de l’opérateur site:. On pourra entrer la requête suivante site:www.twitter.com #nomdutilisateur bib doc. Là encore, on retrouve vite le nom du site en question.

Si l’utilisateur a supprimé certaines de ses publications sur les médias sociaux ou a fermé son compte, il n’existe à notre connaissance aucune méthode pour les retrouver. Il y a bien eu par le passé quelques outils qui permettaient par exemple de retrouver des tweets supprimés comme Deadbird par exemple, mais la quasi-totalité de ces outils a aujourd’hui disparu.

Méthode 4 : Remonter le cours de ses recherches à partir de quelques mots-clés

En règle général, donc, si on se souvient de la source ou du nom de la personne ou du compte qui avait signalé une information ou une source, on a de fortes chances de les retrouver. Par contre, si nos souvenirs sont beaucoup plus parcellaires et que l’on se souvient à peine de quelques mots-clés pouvant caractériser cette source ou information, cela peut vite devenir compliqué.

Dans ce cas-là, le réflexe le plus évident est d’aller interroger les moteurs de recherche et bien évidemment Google.

Mais malheureusement, Google n’est pas toujours notre allié. Il l’est même de moins en moins (voir notre encadré « Les évolutions récentes de Google pour remonter le fil de ses recherches passées »)

Prenons un exemple : dans le cadre de la rédaction d’un article sur Google, nous souhaitons retrouver un article de blog paru il y a quelques années et que nous avions lu à l’époque et qui mentionnait le fait que Google avait déposé un brevet indiquant qu’il pourrait combiner résultats naturels et sponsorisés sur sa page de résultats.

Malheureusement, nous ne nous souvenons plus de la date exacte (sauf que ce n’était pas en 2019 et probablement pas antérieur à 2017), ni de la source ou de l’auteur de l’article (si ce n’est qu’il s’agissait d’un blog). Par contre, nous sommes certains que l’article était en anglais et qu’il y avait des schémas.

  • Première étape : essayer de décrire le contenu de l’article sous la forme d’une requête. Nous tentons donc une première requête dans Google : patent Google natural results adwords
  • Nous limitons ensuite par date (du 1er janvier 2017 au 31 décembre 2018), mais toujours aucune trace.
  • Nous tentons alors d’autres requêtes en utilisant d’autres mots-clés comme par exemple Google patent organic paid results mais toujours rien.
  • Comme l’article de blog contenait de schémas très distinctifs, nous décidons d’interroger Google Images, en utilisant les requêtes précédemment utilisées sur le moteur Web. Et cette méthode s’avère payante, car les schémas apparaissent directement dans les premières images et permettent de se rendre sur le billet de blog en question.

Surprenant !

  • À l’issue de nos tests, et après avoir consulté à plusieurs reprises l’article de blog sur le brevet de Google, il nous a été impossible de reproduire la même expérience.
    Quelle que soit la requête (patent Google natural results adwords, Google patent organic paid results, etc.), l’article apparaissait dé­sormais systématiquement en premier résultat (même en suppri­mant l’historique Google ou du navigateur).On pourrait croire qu’il s’agit d’une forme de personnalisation où Google fait apparaître sur la pre­mière page de résultats un document que nous avons déjà consulté, mais en réalité il n’en est rien.Pour le vérifier, nous avons demandé à plusieurs personnes (basées dans différents pays) d’entrer la même requête dans Google. Et pour tous, l’article arrive désormais en première position.
  • En réalité, l’algorithme de pertinence de Google accorde une part importante au nombre de clics et la visibilité des pages Web. Une page ou site que personne ne consulte est alors très mal classé dans les résultats et pour peu qu’il soit classé au-delà de la 200e position, il n’est même plus visible et accessible.
    Mais il suffit que des personnes cliquent et se rendent à nouveau sur cette page (ce que nous avons dû faire au moins 5 fois lors de nos tests) pour qu’elle remonte en haut du classement pour tous les internautes !
  • Retrouver des contenus sur Google à partir de quelques souvenirs parcellaires n’a rien d’évident et il n’existe pas de méthode miracle. Il faut essayer de rassembler le maximum de souvenirs et d’indices et explorer différentes pistes : requêtes sur Google, requêtes sur les autres moteurs de Google (Actualités, Images, vidéos, etc.), interroger d’autres moteurs, tester des recherches dans les médias sociaux, etc. Mais dans tous les cas, cela peut vite devenir long et fastidieux.
  • Il est alors préférable de réfléchir en amont à des solutions permettant de sauvegarder et garder des traces aussi bien de ses requêtes que des contenus visualisés afin de créer une sorte de bases de données de ses recherches antérieures. Mais de quels méthodes et outils dispose-t-on ? Et lesquels sont les plus efficaces ?

Les évolutions récentes de Google pour remonter le fil de ses recherches passées

Google affiche de moins en moins de résultats pour une requête donnée : à peine 100 à 200 résultats sont généralement visualisables. Si la page en question ne se trouve pas dans ces 100/200 premiers résultats, elle est alors perdue dans les limbes du Web et vos chances de la retrouver sont très minces même si elle existe toujours.

D’autre part, Google a tendance à afficher en priorité des résultats récents. Si la page que vous recherchez a été publiée il y a quelques années, il y a très peu de chance qu’elle remonte. D’ailleurs, Google efface de son index toute page n’ayant pas été remise à jour depuis plus de 10 ans et dévalue celles qui sont anciennes. Si on se souvient plus ou moins de la date ou année, le filtre par date proposé par Google pourra s’avérer pertinent (on entrera alors un intervalle de dates afin d’exclure les résultats le plus récents).

La seule bonne nouvelle avec les évolutions de Google dans ce contexte, c’est que depuis plusieurs années, Google a déployé la recherche en langage naturelle et il élargit automatiquement la requête aux différentes formes d’un mot, synonymes, etc. Ainsi, même si on ne se souvient pas précisément des termes employés sur la page en question, Google pourrait tout de même réussir à la retrouver.

D’autre part, il a lancé il y a maintenant un peu plus d’un an des « activity cards » qui permettent d’afficher des résultats issus de précédentes recherches lorsque la requête actuelle semble être sur un sujet proche. Attention cependant, cela suppose de ne pas avoir effacé son historique de recherche et cette fonctionnalité ne fonctionne pour l’instant que sur mobile aux Etats-Unis.

Quels outils pour garder des traces de ses recherches ?

Nous avons identifié un certain nombre d’outils susceptibles de répondre à cette problématique. Cependant, attention au caractère éphémère de certains de ces outils. Certains créés il y a moins d’un an ont déjà disparu...

Les solutions de sauvegarde manuelles

On dispose tout d’abord de toute une panoplie d’outils souvent gratuits ou freemium permettant d’enregistrer manuellement les pages et documents rencontrés lors de sa navigation. En revanche, ils ne sont pas conçus pour sauvegarder des requêtes et stratégies de recherche.

On retrouve ici des outils de curation ou de bookmarking.

Nous avons choisi de lister ici les outils les plus intéressants repérés au cours des dernières années.

Pocket (anciennement Read it later - https://getpocket.com) existe depuis 2007 et compte de nombreux utilisateurs. Il se définit comme une « bibliothèque permanente de tout ce que vous avez sauvegardé ». Grâce à une extension (Chrome, Firefox, etc.), il permet d’enregistrer d’un simple clic des pages et articles consultés sur le Web auxquels on peut associer des tags. L’un des principaux intérêts est qu’il conserve une copie du texte intégral ce qui peut s’avérer très utile quand une page disparaît. Il fonctionne sur un modèle freemium : la conservation illimitée des articles/pages et la recherche sur le texte intégral ne sont disponibles que dans la version payante (44.99 $ par an).

Dans la même veine, on trouve Evernote (https://evernote.com), un outil de prise de note qui offre également une fonctionnalité de Web Clipper pour sauvegarder des pages Web en texte intégral pour les retrouver et y effectuer des recherches plus tard. Il fonctionne également sur un modèle freemium.

Si ces deux outils sont probablement les plus connus, d’autres méritent tout de même qu’on leur accorde un peu d’attention :

  • Mediatag (https://mediatag.io/home) qui permet d’enregistrer des pages Web, images et vidéos et même des morceaux de vidéos uniquement ;
  • Keep Everything (http://www.groosoft.com/keepeverything/) qui permet d’enregistrer depuis un mac ou un iPhone des pages Web en texte intégral, des images ou vidéos et de la synchroniser automatiquement avec Dropbox ;
  • Keepmark (https://keepmark.io/en) qui se définit comme un « personal document manager » et qui permet notamment d’enregistrer des bookmarks ou de sauvegarder des pages Web en texte intégral ;
  • Diigo (https://www.diigo.com), un outil de bookmarking très utilisé par les professionnels de l’information par le passé, mais qui n’a pas complètement disparu et a revu sa copie il y a quelques années. Il permet notamment de catégoriser finement ses signets et de conserver des copies des pages.

On notera également que la plateforme de publication Medium est actuellement en train de tester une fonctionnalité Save to Medium qui permet d’enregistrer n’importe quelle URL pour les conserver, les afficher et les lire directement dans l’application Medium. Medium cherche ici à rassembler en un seul et même endroit les lectures des internautes sur le Web.

Notre avis

Tous ces outils sont intéressants et disposent chacun de leurs propres spécificités. Il faut donc sélectionner un outil qui répond aux mieux à ses problématiques et contraintes spécifiques.
Certains outils sauvegardent les contenus en ligne tandis que d’autres les sauvegardent sur le PC de l’utilisateur. Certains sont gratuits, d’autres freemium. Certains existent depuis de très nombreuses années et d’autres sont très récents. Certains permettent d’indexer et structurer les contenus avec des systèmes de tags ou classification plus ou moins évolués.

Attention aussi aux modèles économiques qui peuvent changer. On pensera par exemple à tous les internautes qui sauvegardaient leurs contenus sur Scoop.it dans la version gratuite et qui ont eu toutes les difficultés du monde à récupérer leurs données quand l’outil est devenu complètement payant. Il faut donc avoir conscience qu’on peut perdre toutes ses données lorsqu’il s’agit d’un outil gratuit hébergeant les données sur le cloud.

Mais le véritable problème, c’est que ces outils fonctionnent sur un modèle manuel qui implique que l’utilisateur va devoir cliquer sur un bouton pour enregistrer chaque page et éventuellement leur associer des tags, ce qui demande une véritable rigueur dans la démarche de recherche et peut vite devenir chronophage. Et dès lors que l’on souhaite se créer une base de données de ses recherches et navigations antérieures, on imagine mal que des personnes aient le temps et l’envie de sauvegarder manuellement l’ensemble des recherches, pages et sites rencontrés.

Cela peut sûrement fonctionner sur une sélection de pages et documents pertinents que l’on souhaite conserver et mettre de côté, mais c’est inenvisageable pour sauvegarder l’intégralité de son processus de recherche.

Les solutions automatiques

Pour sauvegarder l’intégralité de son processus de recherche, il faut se tourner vers des outils de sauvegarde automatique ou semi-automatique.

Parmi les outils les plus intéressants que nous avons repérés, on trouve :

  • Browser History Viewer (https://www.foxtonforensics.com/browser-history-viewer), un logiciel gratuit qui permet d’extraire automatiquement son historique de navigateur. Il offre un système de filtres par mots-clés et dates, enregistre également les images visualisées par l’internaute ainsi qu’une version cache de toutes les pages visitées. Seul problème : il ne cherche que sur les titres, dates et urls.
  • On trouve également History Search (https://historysearch.com), une extension de navigateur qui fonctionne notamment sur Chrome, Firefox ou Edge et enregistre automatiquement toutes les pages Web visitées et permet ensuite d’effectuer des recherches sur le texte intégral des pages. La version gratuite ne permet d’accéder qu’aux 3000 dernières pages visitées. Les données sont ici stockées en ligne, mais le créateur indique utiliser un système d’encryption pour garantir la sécurité et confidentialité des données.
  • Fetching.io (http://fetching.io/get-started) propose lui aussi d’enregistrer et indexer toutes les pages visitées (sauf celles consultées avec les modes Private ou Incognito de son navigateur). L’outil fonctionne sur Firefox, Chrome ou Safari et les contenus peuvent soit être enregistrés sur le cloud (3.33$ par mois) soit sur son ordinateur (29$99 pour l’achat du logiciel).

On s’attardera enfin un peu plus sur deux outils très prometteurs.

Tout d’abord Memex (https://worldbrain.io), une extension récente qui veut permettre d’annoter sa navigation, rechercher au sein de son historique et organiser son historique. Contrairement aux autres acteurs cités, il est possible d’ajouter des commentaires, surligner des pages Web, on peut également taguer les pages pour les retrouver plus facilement et on dispose de filtres par dates, tags ou nom de domaine et la recherche porte sur le texte intégral. Le stockage s’effectue sur l’ordinateur de l’utilisateur, mais Memex indique travailler également sur un stockage sur le cloud avec synchronisation possible sur différents supports (tablettes, téléphones portables, etc.). On peut néanmoins déjà faire des backups manuels sur le cloud comme sur Dropbox par exemple.

Enfin, le dernier outil et probablement l’un des plus intéressant et des plus complet s’appelle Hunchly (https://www.hunch.ly). Très utilisé par les professionnels de l’OSINT, spécialistes de la sécurité ou encore journalistes d’investigation, il jouit déjà d’une excellente réputation :

  • Il permet de sauvegarder toutes ses recherches, pages et sites visités ;
  • conserve même tous les contenus visualisés sur les médias sociaux (qu’il s’agisse de posts, images ou vidéos) ainsi que les investigations sur le Dark Web ;
  • permet de blacklister (et donc de ne pas enregistrer la navigation sur certains sites comme Gmail, Facebook, etc.) ;
  • permet d’associer son historique à des projets précis ;
  • et offre aussi des fonctionnalités de recherche et de classification poussées.

Et le point positif, c’est qu’il peut être activé et désactivé en un clic. Il coûte 129$ US pour 1 licence ce qui reste raisonnable.

Seul point négatif : il n’est disponible que sur Chrome...

Notre avis

Ces outils ont un intérêt certain pour les professionnels de l’information et ont toute leur place dans leur panoplie d’outils. Reste à trouver le bon équilibre entre tout sauvegarder sur son PC et non sur le cloud pour des questions de confidentialité sans surcharger son disque dur. C’est pour cela qu’un outil comme Hunchly est très intéressant, car il permet de doser habilement ce que l’on souhaite sauvegarder en fonction de certaines recherches ou projets.

Conclusion

Il est aujourd’hui important de mieux documenter ses recherches sur le Web pour gagner en productivité pour des recherches et veilles futures. Des projets de bases de données internes capitalisant les requêtes et résultats de recherche ont existé par le passé abandonnées, car peu utilisées et chronophages.

Les technologies ont cependant bien évolué et les nouveaux outils de sauvegarde automatique peuvent désormais rendre cette tâche plus simple et moins chronophage.

De plus, la démarche de recherche d’information est souvent très et trop personnelle. Il n’existe pas de méthode unique et, pour une même question, il existe une multitude de méthodes pour arriver aux résultats. Le cheminement est donc rarement très linéaire et peu compréhensible et reproductible pour une personne extérieure.

Par contre, il y a un véritable intérêt à sauvegarder et capitaliser son historique de recherche et navigation pour soi-même.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...

HELIX_CLOSE_MENU