Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Tirer parti de la recherche visuelle et d’images pour la veille

Netsources no
130
publié en
2017.09
1237
Tirer parti de la recherche visuelle et d’images pour la ... Image 1
Tirer parti de la recherche visuelle et d’images pour la ... Image 1

Quand on pense recherche d’information et veille, on pense généralement au texte et moins à l’image. Dans l’imaginaire collectif, la recherche de contenus visuels renvoie davantage à l’iconographie et aux applications grand public qu’à un usage professionnel. Le lien entre les images et la veille concurrentielle et stratégique n’est pas une évidence...

Les outils du Web dédiés aux images (moteurs de recherche, bases de données, réseaux sociaux) ne sont pas nouveaux mais ils ne cessent de se multiplier et de se perfectionner. Le développement de l’intelligence artificielle y est pour quelque chose.

D’autre part, on remarque ces derniers temps une tendance prenant toujours plus d’ampleur : la recherche visuelle. On ne cherche plus seulement des images à partir de contenu textuel (mots-clé) mais l’image elle-même peut devenir le point de départ de la recherche en lieu et place des mots-clés.

Nous avons choisi dans cet article de faire le point sur les dernières évolutions en matière de recherche visuelle, de dresser un panorama des outils qui y ont recours et de ceux disponibles pour la recherche d’images. Nous montrerons ensuite dans quels cas la recherche visuelle ou d’images peut avoir un intérêt pour la recherche d’information et la veille et quelles sont les méthodes à adopter en fonction de chaque situation.

La recherche visuelle en pleine expansion

La recherche par l’image n’est pas un phénomène nouveau. On estime que la recherche visuelle a fait son apparition il y a presque dix ans, en 2008, avec le lancement de TinEye, le premier moteur de recherche inversée. Il suffit dans ce type de recherche de charger une image depuis son ordinateur ou d’entrer l’url d’une image sur le Web pour que le moteur retrouve des images identiques ou similaires disponibles sur le Web. Deux ans plus tard, Google s’est lancé dans la course avec son application Google Goggles pour chercher de l’information à partir de photos prises avec son téléphone.

Mais avec le développement de l’intelli­gence artificielle, la recherche visuelle progresse et pas uniquement chez les moteurs de recherche traditionnels.

Les moteurs de recherche inversée

Google et Bing proposent désormais tous deux des fonctionnalités de recherche inversée.

TinEye existe toujours mais on pourra également citer Imageraider (https://www.imageraider.com) et RevEye Reverse Image Search, une extension Chrome qui permet de lancer des recherches d’images inversées sur Google, Tineye, Yandex et Baidu.

Google Lens : au-delà de la recherche inversée

Mais Google ne s’arrête pas là. Il a présenté en mai dernier une nouvelle fonctionnalité destinée à son Google Assistant et Google Photos appelée Google Lens.

L’utilisateur n’aura qu’à pointer son téléphone vers quelque chose pour que Google lui donne des informations à son sujet. S’il s’agit d’une fleur, l’utilisateur aura des informations sur son espèce, s’il s’agit d’un restaurant sur les avis de consommateurs, s’il s’agit d’une affiche de concert des informations sur l’artiste et la possibilité d’acheter les billets et ainsi de suite.

Pour l’instant, Google n’a pas dévoilé la date de lancement de Google Lens.

Les réseaux sociaux

Parmi les autres acteurs ayant investi la recherche visuelle, on compte également les réseaux sociaux dédiés à l’image, principalement Pinterest.

Pinterest a été lancé en 2010 et permet à ses utilisateurs de créer et partager des collections d’images repérées sur le Web.

A la fin de l’année 2015, Pinterest a lancé son propre outil de recherche visuelle pour effectuer des recherches au sein d’une image en sélectionnant des éléments précis présents dans l’image et ainsi repérer des objets similaires à ceux sélectionnés sur l’écran. Le moteur interne du site ne permet cependant pas d’effectuer des recherches très élaborées. On peut ainsi rechercher sur l’intégralité des contenus, les personnes ou les boards (des tableaux de bords créés par les utilisateurs du réseau).

En 2017, Pinterest a ajouté trois nouvelles fonctionnalités liées à la recherche visuelle :

  • Pinterest Lens qui fonctionne sur téléphone uniquement : l’utilisateur prend une photo d’objets réels et Pinterest se charge alors de retrouver des images d’objets similaires sur sa plateforme ;
  • Instant Ideas qui permet d’un clic sur un Pin (image postée sur le réseau social) de voir des images similaires ;
  • et enfin Shop the look qui permet d’acheter directement des produits repérés sur des Pins.

Les sites de vente en ligne

Les sites de vente en ligne ont également massivement investi dans la recherche visuelle. L’image devient alors un outil au service de la puissance commerciale.

Amazon propose un outil de recherche visuelle baptisé Amazon Remembers depuis 2009 mais vient d’améliorer considérablement cette fonctionnalité. Les utilisateurs peuvent désormais prendre des photos de vêtements, objets ou codes barre, les ajouter à la barre de recherche d’Amazon et visualiser les objets correspondants ou proches dans l’interface d’Amazon.

Ebay vient également de lancer plusieurs fonctionnalités de recherche visuelle en permettant notamment d’intégrer des photos d’objets réels (Image search) ou en partageant des urls de sites (Find it on Ebay) pour rechercher des objets similaires dans sa plateforme.

Zalando propose également une foncti­onnalité de recherche visuelle basée sur la similarité depuis 2014 et travaille actuellement sur des projets liés au machine learning et à l’intelligence artificielle permettant de détecter les couleurs, textures et matières des produits pour bien les catégoriser et les rechercher.

On sait également qu’ASOS et d’autres boutiques en ligne travaillent sur ces développements.

La recherche visuelle intégrée aux outils de veille

Même si jusqu’à présent les innovations en matière de recherche visuelle concernent principalement les outils grands publics, les outils professionnels et notamment les outils de veille commencent eux aussi à s’intéresser à cette question.

Les précurseurs en la matière ont été Talkwalker début 2016 mais d’autres acteurs comme Digimind, Radarly ou Brandwatch ont ensuite rapidement suivi. Tous proposent une solution de reconnaissance d’images permettant de repérer des logos de marques sur des images et, ce, même si le nom de la marque n’est cité nulle part.

Nous reviendrons sur cette question dans un prochain article en comparant les solutions proposées par les différents acteurs.

Les outils dédiés à la détection de contrefaçons

Sur un créneau bien spécifique, on pensera également aux outils de détection de contrefaçons. A partir d’images des produits, ces outils crawlent le Web et parviennent à y détecter des contrefaçons.

Parmi ces acteurs, on pourra citer notamment :

  • Markmonitor (appartient à Clarivate Analytics) ;
  • Data & Data ;
  • ou encore Counterfeit Technology.

Innovations pour la recherche d’images

Du côté de la recherche d’images, où la recherche s’effectue cette fois à partir de mots-clés, l’intelligence artificielle a également apporté des innovations notamment grâce à la reconnaissance d’objets.

Mais en la matière, ils semblent que les outils professionnels aient du retard sur les applications grand public. Nous avons choisi ici de faire le point sur les outils grand public disponibles en matière de reconnaissance d’objets et de voir comment il est possible d’en tirer parti d’un point de vue professionnel.

Sur Iphone par exemple, l’application Photos facilite la recherche de photos représentant une personne, un lieu ou un objet précis. La reconnaissance faciale avancée et la technologie de reconnaissance d’objets permet ainsi d’effectuer une recherche dans ses propres photos par personne et objet. On pourra entrer le terme plage pour voir ressortir toutes les photos présentes sur son téléphone dans un contexte de plage, et ce, sans avoir indiqué à aucun moment qu’il s’agissait d’une plage.

Les moteurs d’images des géants du Web : Google et Bing

Pour la recherche d’images, les deux grands moteurs Google et Bing sont des incontournables. Tous les deux proposent un moteur d’images depuis de nombreuses années mais ils ne cessent de s’améliorer notamment pour tout ce qui a trait à la reconnaissance d’objets.

Google Images

En quelques années, le moteur d’images de Google a beaucoup évolué et propose désormais les fonctionnalités suivantes : on peut entrer un ou plusieurs mots-clés dans la boite de recherche en tirant parti des fonctionnalités de recherche offertes (utilisation des opérateurs booléens AND par défaut, OR et NOT sous la forme d’un tiret et les guillemets pour rechercher une expression exacte).

Dans un second temps, on peut filtrer les résultats par taille, couleur, type (visage, photo, clipart, images animées), période et droits d’usages (licences Creative Commons ou non). Pour chaque image, Google propose une liste d’autres images qu’il juge similaires.

La recherche d’images est l’un des axes sur lesquels Google n’a de cesse d’innover. Parmi les dernières évolutions en date, Google a ajouté la possibilité de limiter la recherche aux gifs animés et images avec fond transparent. Et en avril dernier, Google a ajouté sur sa version mobile un carrousel de produits (sacs à main, chaussures, lunettes) identifiés dans une photo de personne trouvée sur le Web, avec un lien pour les acheter directement.

Bing Images

Le moteur d’images de Bing est assez similaire en termes de fonctionnalités : recherche par mot-clé, filtres sur la taille de l’image, la couleur, le type d’image, l’orientation (carré, paysage, portrait), les personnes (visages ou têtes et épaules uniquement), date et licence.

On apprenait il y a peu que Bing venait d’améliorer ses fonctionnalités de recherche d’images et notamment de reconnaissance d’objets.

Les internautes pouvaient d’ores et déjà effectuer des recherches sur des objets présents au sein d’une image. Mais il fallait pour cela qu’ils entourent manuellement l’objet en question dans l’image. Désormais, le moteur est capable de détecter automatiquement les objets au sein des images et l’internaute n’aura plus qu’à cliquer sur la petite icône pour lancer la recherche sur des objets similaires. Pour l’instant cela ne fonctionne que sur la version desktop et non mobile.

On sait par ailleurs que Google travaille depuis des années sur la reconnaissance d’objets au sein des images et des vidéos mais il ne propose pas, à l’heure actuelle, de fonctionnalités similaires sur son moteur d’images.

Les réseaux sociaux basés sur l’image : Pinterest, Instagram et Flickr

Les réseaux sociaux dédiés à l’image ont eux aussi investi le champ de la reconnaissance d’objets. Pinterest, bien sûr, dont nous avons déjà parlé mais aussi Flickr.

Flickr est un site de partage de photos (personnelles mais on y trouve également de nombreux photographies faites par professionnels) qui existe depuis 2004 et appartenait à Yahoo (maintenant Verizon). Depuis 2015, Flickr a mis au point un système de reconnaissance automatique de visages, objets, couleurs, etc.

Le moteur interne permet donc désormais d’effectuer des recherches sur des photos, des personnes ou des groupes et de filtrer les résultats par couleur, type de licence, orientation, taille, date et la recherche peut porter sur tout le contenu ou uniquement les tags.

Instagram, autre réseau social de référence pour l’image, ne semble pas avoir investi pour le moment le champ de la recherche visuelle ou de la reconnaissance d’objets. Il reste néanmoins une source d’information importante pour la recherche d’images.

Rappelons qu’Instagram existe depuis 2010 et permet à ses utilisateurs de partager leurs propres photos et vidéos. Contrairement à Pinterest, les utilisateurs ne peuvent pas repartager les contenus des autres utilisateurs. Il n’est pas non plus possible de poster des liens vers des contenus externes.

Le moteur de recherche interne est également très limité.

Autres outils pour la recherche d’images

Au-delà des outils cités précédemment, les autres sources d’informations et outils dédiés à la recherche d’images n’ont pas pris pour le moment le virage de l’intelligence artificielle. Il n’en reste pas moins important de connaître leur existence pour la veille et la recherche d’informations.

Nous avons dressé ici une typologie des outils à prendre à compte.

Les outils satellites

Google occupe également une place importante sur le marché de la recherche d’images satellites avec Google Earth qui existe depuis de très nombreuses années. Dans la même veine, on citera TerraPattern, un outil de recherche d’images satellites qui ne fonctionne malheureusement que sur quelques grandes villes américaines et …Berlin. La société indique cependant vouloir rajouter d’autres villes prochainement.

Il ne faudra pas oublier Google Street View ou Bing Street Side qui permettent de naviguer visuellement dans les rues du monde entier.

Les moteurs d’images libres de droits

Pour la recherche d’images, on ne saurait oublier tous les moteurs spécialisés sur les images libres de droits ou sous licence Creative Commons. Rappelons que les licences Creative Commons permettent de vérifier immédiatement si l’œuvre est diffusable et réutilisable gratuitement et dans quelles conditions.

Parmi ces nombreux outils, on pourra citer :

Les moteurs de photos de stocks

Parallèlement aux outils de recherche d’images libres de droits, on trouve également toute une panoplie de sites, bases de données et moteurs de photos de stocks, c’est à dire d’images réutilisables mais payantes. Le choix d’images est généralement plus large et de meilleure qualité.

On citera :

Les moteurs de logos et d’infographies

Dans une catégorie un peu à part, on citera également le moteur de logos Instant Logo Search (http://instantlogosearch.com) qui permet de rechercher parmi des milliers de logos, de les télécharger et de les réutiliser gratuitement.

Pour l’aspect visuel, il faudra également penser aux infographies et aux outils permettant d’en identifier sur le Web. On pourra mentionner :

Il est également possible de retrouver des infographies en entrant le terme infographie combiné avec les termes de sa recherche dans Google images, Google news ou encore Pinterest.

Bases de données d’images chez les serveurs et bases de données

Certains serveurs et grands fournisseurs d’information payante proposent égale­ment des bases de données dédiées à l’image. C’est notamment le cas d’EBSCO.

Chez EBSCO, on citera :

  • AP Images Collection, la collection de photographies de l’agence de presse américaine avec plus de 12 millions de photos remontant jusqu’à 1826,
  • Art Museum Image Gallery, un accès aux collections de musées avec plus de 158 000 images (peinture, sculpture, photographies, textiles, etc.),
  • Scientific & Medical ART Imagebase, une base de données d’images médi­cales avec plus de 24 000 illustrations.

Bases de données marques et brevets 

Dans le domaine des marques figura­tives, la recherche par les images, qui répondait à un vrai besoin, a pris un réel essor il y a quelques années, après quelques tentatives peu concluantes les années précédentes. Par contre, la recherche sur les caractéristiques des images existe depuis longtemps.

On pourra citer :

En ce qui concerne les images figurant dans les brevets, elles sont présentes essentiellement pour illustrer ce qui est précisé dans le texte, de façon très détaillée. La recherche par les images n’est pas vraiment un besoin, d’autant que ces images sont souvent très complexes.

Comme nous avons pu le voir, le champ de la recherche d’images est très vaste et les sources et outils utilisés dépendent grandement du sujet et de la thématique étudiée.

Et c’est sans compter toutes les autres sources et outils non spécifiquement dédiés aux images qui proposent des fonctionnalités pour limiter la recherche aux images...

Les applications à la veille et la recherche

On constate que les principales innovations en matière de recherche visuelle ou de reconnaissance d’objets se concentrent surtout sur les outils grands publics (moteurs de recherche, réseaux sociaux spécialisés sur les images ou encore sites de vente en ligne) même s’ils peuvent également être utilisés dans la sphère professionnelle. Du côté des outils strictement professionnels, les plateformes de veille commencent à proposer des fonctionnalités innovantes en matière de recherche d’images.

Voyons maintenant dans quels cas la recherche visuelle ou d’images peut avoir un intérêt dans un contexte de veille ou de recherche d’informations.

Les images pour le sourcing

Dès la phase de sourcing, la recherche visuelle et d’images pourra représenter un bon moyen de compléter son sourcing. Rappelons que le sourcing est l’étape qui consiste à identifier les sources pertinentes à mettre sous surveillance. Il est l’un des éléments-clés de la mise en place d’un processus de veille.

A partir d’une image tirée d’un article pertinent dans le cadre de sa veille, d’un événement, d’une photo d’une personnalité citée dans la recherche ou la veille, le logo d’une société surveillée, etc., on pourra lancer des recherches dans des moteurs de recherche inversée comme ceux de Google, Bing ou encore TinEye et ainsi repérer des images et extension des pages web traitant d’une thématique similaire. Ces sources pourront ensuite être intégrées au corpus de veille.

E-réputation : marques et personnes

La recherche d’images prend tout son sens dans un contexte de e-réputation qu’elle soit appliquée à des personnes ou à des marques (voir notre article : la recherche d’information appliquée aux personnes : de la simple vérification aux décisions stratégiques - NETSOURCES n°128 - Mai/Juin 2017)

On aura alors intérêt à recourir :

  • aux moteurs d’images comme Google, Bing pour voir ce qui ressort à partir d’un nom de personne, de marque ou d’entreprise ;
  • aux réseaux sociaux comme Pinterest, Instagram et Flickr ;
  • aux moteurs de recherche inversée pour détecter d’éventuelles images, détournées, des montages ou des images publiées à son insu ;
  • aux plateformes de veille proposant un système de reconnaissance d’images/de logo pour détecter toutes les références à une marque sans qu’elle soit pour autant citée textuellement (attachement à la marque, informations négatives à propos de la marque, montages et détournements).

Retrouver le nom d’une personne à partir d’une image

Autre cas de figure. Il peut arriver qu’on identifie lors d’une veille ou d’une recherche une personne sur un site Web, un réseau social, etc. sans pour autant disposer de son nom et des informations nécessaires pour la retrouver.

Première possibilité : utiliser les moteurs de recherche inversée pour identifier d’autres pages Web utilisant la même image et susceptibles cette fois-ci de fournir le nom de la personne.

Autre possibilité : analyser en détail l’url de l’image en question pour voir si le nom de la personne n’y est pas indiqué.

Identifier des experts

L’identification d’experts est une problé­matique bien connue des professionnels de l’information. L’image peut ici aussi jouer un rôle et on pourra tirer parti des outils de recherche visuelle.

On commencera tout d’abord par les moteurs classiques d’images comme ceux de Google ou de Bing. Chez Google images, une fois la recherche lancée, on peut choisir de limiter la recherche aux visages (en sélectionnant type puis visages).

Chez Bing, il n’existe pas de fonctionnalité tout à fait équivalente mais on peut spécifier dans les filtres, dans le cas de personnes, si l’on souhaite limiter aux visages uniquement ou à la tête et épaules. Cela semble permettre de mettre en avant les personnes par rapport aux autres contenus.

Une fois un ou plusieurs experts identifiés, on pourra relancer des recherches sur les noms de ces personnes dans les moteurs d’images pour détecter d’autres personnes gravitant autour de ces personnalités et éventuellement des experts du même sujet.

Contrefaçons / copies

Comme nous le mentionnions précé­demment, il existe des platefromes et outils spécialisés dans la détection de contrefaçons. Néanmoins, si l’on ne dispose pas de ces outils, on pourra recourir à des solutions plus artisanales à partir d’outils gratuits :

  • les moteurs de recherche inversée pour détecter des produits similaires ;
  • les fonctionnalités de recherche visuelle des réseaux sociaux comme Pinterest ;
  • les fonctionnalités de recherche visuelle des sites d’e-commerce comme Amazon, Ebay, etc.

Veille et recherche dans un contexte multilingue

On y pense moins mais la recherche d’images peut avoir un intérêt dans le cas d’une recherche d’information multilingue, notamment dans le cas de langues que l’on ne maîtrise pas et qui sont difficiles à rechercher (car n’utilisant pas l’alphabet latin). Nous avions eu l’occasion d’illustrer ce cas il y a plusieurs années dans un article de NETSOURCES intitulé « Repérer les retombées presse d’une exposition grâce aux images » (NETSOURCES n°97 - mars/avril 2012).

Dans ce cas précis, nous avions utilisé l’image de l’affiche de l’exposition dans les moteurs de recherche inversée pour repérer des articles de presse et sites qui en parlaient. Cela nous avait permis d’identifier des articles en japonais ou en chinois qui n’auraient pas pu être retrouvés de manière textuelle, même si des noms de marques ou d’entreprises figurent en caractères latins dans ces articles.

Cette méthode peut s’appliquer à toutes sortes de veilles ou de recherches à con­dition de disposer d’une image suffisa­mment distinctive.

Veille concurrentielle & innovation

Bien que ce ne soit pas toujours évident, les images ont toute leur place dans un processus de veille concurrentielle et d’innovation.

Comme nous avons pu le voir précédemment, une photo de produit, de dirigeant, etc. peut permettre de lancer une recherche d’images similaires et par là-même de détecter des informations concurrentielles.

On pourra également penser aux outils satellites présentés précédemment pour analyser les sites de production de concurrents (voir notre article « Veille concurrentielle dans l’Industrie : la cas des usines » - NETSOURCES n°126 - janvier/février 2017).

Enfin les réseaux sociaux d’images comme Pinterest pourront être un moyen de détecter de nouveaux produits innovants.

Veille et recherche scientifique et technique

Cette préoccupation de recherche sur les images n’est pas nouvelle. En effet, Cambridge Scientific Abstracts avait lancé en 2007 le produit CSA Illustrata, qui indexait les légendes des illustrations des articles scientifiques, ouvrant ainsi de nouvelles possibilités de recherche. Proquest, qui a racheté CSA, a annoncé l’arrêt du produit en 2016.

Par ailleurs, Springer Images avait été arrêté en mai 2014. D’autre part, dans le domaine de la chimie, les recherches sur les structures (leurs dessins) offrent toujours plus de possibilités.

Vérifier la véracité d’une information

Au-delà de la phase de collecte, l’image peut jouer un rôle dans la vérification de l’information. Lorsque l’information provient d’une source inconnue ou douteuse, les images qui y sont présentes permettront d’obtenir des indices quant à la véracité de la l’information. En effet, si l’image est truquée ou ne correspond pas aux faits présentés dans un article, il est fort probable que toute l’information présentée soit à prendre avec précautions. En cette période où l’on parle quotidiennement des fake news, ces quelques éléments de méthode pourront être utiles.

On pourra ainsi utiliser les outils de recherche inversée pour vérifier si l’image n’est pas utilisée sur d’autres pages et sites (et s’il ne s’agit pas de photos de stocks), les outils d’images satellites pour vérifier si la localisation indiquée correspond bien à la réalité.

Enfin on pourra utiliser des outils comme Findexif.com (qui permet d’extraire les données Exif d’une photo comme la date de prise de vue, et d’identifier avec quel appareil elle a été prise, etc.) ou Foto Forensics, un site qui détecte les anomalies d’une photo et permet ainsi de repérer des montages.

Illustrer ses livrables

Enfin l’image pourra servir au moment de la phase de diffusion d’une veille car, n’oublions pas qu’« une image vaut mieux que mille mots ».

C’est à ce stade que les moteurs d’images libres de droit, les moteurs de photos de stock ou les moteurs de logo ou infographies trouveront leur utilité.

Conclusion

Même si le lien entre veille con­currentielle et stratégique et con­tenus visuels n’est pas toujours des plus évidents, la prise en compte de l’image dans le processus n’est pas à négliger.

Cependant, on constate que la majorité des innovations quant à la recherche visuelle et d’images liées au développement de l’intelligence artificielle s’applique pour le moment principalement à des outils et applications grands publics.

L’introduction dans la sphère professionnelle n’en est qu’à ses balbutiements. Il faudra donc suivre ce secteur avec intérêt dans les prochaines années...

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...

HELIX_CLOSE_MENU