La sélectivité plutôt que la quantité
Le fondateur de DeepNews a récemment été longuement interviewé dans l’excellent podcast Ginkiohttps://ginkio.com/podcast/21/frederic-filloux-qualite-de-l-info-et-machine-learning-le-pari-de-deepnews-ai sur les mutations des médias.
- On retiendra de cette interview que, chez Deepnews, l’idée de départ est qu’il faut un sourcing précis et de qualité.
Le fondateur explique ainsi qu’il existe deux types d’informations : les « commodity news » que l’on retrouve partout gratuitement et qui n’ont aucune valeur ajoutée, et de l’autre « l’information à valeur ajoutée ». C’est sur cette dernière qu’ils se sont focalisés.
Pour la newsletter gratuite, 600 sources anglophones ont été sélectionnées manuellement, car les fondateurs de Deepnews ont considéré que surveiller le plus de sources possible était en réalité inefficace.
Pour les newsletters payantes, le corpus varie d’un sujet à l’autre et il est prévu de faire appel à des experts des secteurs concernés pour valider les sources.
« On a décidé de travailler sur un corpus un peu fermé. On a regardé chacune de nos sources dans le détail : des journaux, des publications universitaires, mais aussi des petites sources. C’est une des spécificités de Deepnews à laquelle je tiens énormément. On part du principe que sur internet existent des articles extrêmement riches et très largement sous-exploités. Sur tous les sujets, il y a un niveau d’expertise absolument phénoménal. Nous avons vocation à détecter ce niveau d’expertise. » Frédéric Filloux, fondateur de Deepnews, dans le podcast Ginkio du 19 décembre 2019.
Un tandem humain/machine learning
Même si le discours commercial sur leur site Web met beaucoup en avant la notion de machine learning pour détecter des informations de qualité, il s‘agit en réalité plutôt d’une complémentarité humain/algorithme.
L’humain sélectionne un corpus de sources qualifiées, l’algorithme passe en revue tous les articles publiés dans ces sources en lien avec le thème de la newsletter et sélectionne les 25 articles qu’il évalue comme étant les plus pertinents. Comme la pertinence n’est pas absolument parfaite (estimée aujourd’hui à 85 % en moyenne, mais inégale selon le domaine d’activité), un humain se charge de revoir, valider et éventuellement annoter les contenus sélectionnés par la newsletter.
Ce temps de travail humain post-sélection est estimé à 1 h par semaine et par newsletter.
L’éternel problème de la boîte noire
Sur de grands sujets d’actualités et d’avenir qui génèrent un gros volume d’articles, même de qualité, l’idée d’un algorithme capable de faire ressortir les 25 articles qu’il faut absolument avoir lu fait bien évidemment rêver.
Mais, comme toujours, il s’agit d’une boîte noire sur laquelle ni l’internaute ni même l’équipe n’a la main. Le fondateur de DeepNews le reconnaît d’ailleurs volontiers dans l’interview de Ginkio
« Notre algorithme est une boîte noire, car il va regarder des informations au travers d’une espèce de tamis, composé de 25 millions de petits points, qu’on appelle des paramètres (weight en anglais). C’est en passant les articles au travers de ce tamis qu’il va mesurer et qu’il va déterminer la qualité de l’article. » Frédéric Filloux, fondateur de Deepnews, dans le podcast Ginkio du 19 décembre 2019.
L’avantage selon lui serait que cette sélection ne pourrait pas être biaisée ni manipulée.
Certes, mais les critères de sélection de l’algorithme ne sont pas nécessairement les mêmes que ceux d’une entreprise qui effectue une veille sur le même sujet. Impossible de mettre l’accent sur un acteur plutôt qu’un autre, impossible d’explorer certains aspects précis. Et comme la newsletter n’est disponible qu’en anglais, impossible d’avoir une vision autre que celle véhiculée dans les médias anglophones.
Les autres acteurs qui surfent sur la sélectivité des sources
DeepNews n’est pas sans rappeler Curation Corp dont nous avions déjà eu l’occasion de parler dans : « La curation pour les managers : le sens de l’information vu par Curation Corp » - NETSOURCES n°135 , Juillet/Août 2018 et qui existe depuis déjà plusieurs années.
- Son créneau : des newsletters thématiques sur de grands sujets d’actualités et d’avenir qui mêlent humain et machine learning.
Curation Corp a récemment évolué en octobre dernier et se focalise désormais sur les risques ESG (Critères environnementaux et sociaux de gouvernance). Il propose une plateforme diffusant des flux d’information thématiques avec une sélection d’articles de presse et d’articles de recherche.
Si l’aspect newsletter thématique est semblable, on constate néanmoins que Curation Corp se base beaucoup moins sur la sélectivité des sources, car il indique surveiller plus de 1,2 million de sources.
Dans la même logique, on notera également que Sindup vient de lancer une nouvelle application gratuite qui permet de suivre des thématiques sur les grandes mutations en cours. On retrouve des grands thèmes et sujets comme l’intelligence artificielle, la réalité virtuelle, l’informatique quantique, etc. Ces flux d’information sont uniquement alimentés par des observatoires composés d’experts.
On retrouve alors cette notion de sélectivité des sources et de veille thématique. Son slogan est d’ailleurs: « se concentrer sur l’essentiel et s’éloigner au maximum de toute logique de surinformation ».
Cependant, quand on y regarde de plus près, il semblerait qu’il s’agisse surtout d’un produit d’appel pour inciter les utilisateurs à souscrire à la plateforme de veille payante. Car, comme l’annonce Sindup à la fin de la description de l’app sur Google Play ou l’app Store, « offrez à votre entreprise la version professionnelle » - créez et déployez votre propre observatoire en accédant à l’ensemble des fonctionnalités ».
Dans un domaine un peu différent, on se rappellera du lancement de TrustedOut l’année dernière qui propose sa solution de « Corpus Intelligence » (base de données de profils de médias, alimentée par l’intelligence artificielle) pour les annonceurs, éditeurs et plateformes de veille. On retrouve ce concept de sélection des sources plutôt que la recherche de la quantité.
Voir notre article : "Ces start-ups qui investissent le champ de l’évaluation des sources et contenus"- NETSOURCES n° 140, mai/juin 2019