Innovations pour la recherche d’images
Du côté de la recherche d’images, où la recherche s’effectue cette fois à partir de mots-clés, l’intelligence artificielle a également apporté des innovations notamment grâce à la reconnaissance d’objets.
Mais en la matière, ils semblent que les outils professionnels aient du retard sur les applications grand public. Nous avons choisi ici de faire le point sur les outils grand public disponibles en matière de reconnaissance d’objets et de voir comment il est possible d’en tirer parti d’un point de vue professionnel.
Sur Iphone par exemple, l’application Photos facilite la recherche de photos représentant une personne, un lieu ou un objet précis. La reconnaissance faciale avancée et la technologie de reconnaissance d’objets permet ainsi d’effectuer une recherche dans ses propres photos par personne et objet. On pourra entrer le terme plage pour voir ressortir toutes les photos présentes sur son téléphone dans un contexte de plage, et ce, sans avoir indiqué à aucun moment qu’il s’agissait d’une plage.
Les moteurs d’images des géants du Web : Google et Bing
Pour la recherche d’images, les deux grands moteurs Google et Bing sont des incontournables. Tous les deux proposent un moteur d’images depuis de nombreuses années mais ils ne cessent de s’améliorer notamment pour tout ce qui a trait à la reconnaissance d’objets.
Google Images
En quelques années, le moteur d’images de Google a beaucoup évolué et propose désormais les fonctionnalités suivantes : on peut entrer un ou plusieurs mots-clés dans la boite de recherche en tirant parti des fonctionnalités de recherche offertes (utilisation des opérateurs booléens AND par défaut, OR et NOT sous la forme d’un tiret et les guillemets pour rechercher une expression exacte).
Dans un second temps, on peut filtrer les résultats par taille, couleur, type (visage, photo, clipart, images animées), période et droits d’usages (licences Creative Commons ou non). Pour chaque image, Google propose une liste d’autres images qu’il juge similaires.
La recherche d’images est l’un des axes sur lesquels Google n’a de cesse d’innover. Parmi les dernières évolutions en date, Google a ajouté la possibilité de limiter la recherche aux gifs animés et images avec fond transparent. Et en avril dernier, Google a ajouté sur sa version mobile un carrousel de produits (sacs à main, chaussures, lunettes) identifiés dans une photo de personne trouvée sur le Web, avec un lien pour les acheter directement.
Bing Images
Le moteur d’images de Bing est assez similaire en termes de fonctionnalités : recherche par mot-clé, filtres sur la taille de l’image, la couleur, le type d’image, l’orientation (carré, paysage, portrait), les personnes (visages ou têtes et épaules uniquement), date et licence.
On apprenait il y a peu que Bing venait d’améliorer ses fonctionnalités de recherche d’images et notamment de reconnaissance d’objets.
Les internautes pouvaient d’ores et déjà effectuer des recherches sur des objets présents au sein d’une image. Mais il fallait pour cela qu’ils entourent manuellement l’objet en question dans l’image. Désormais, le moteur est capable de détecter automatiquement les objets au sein des images et l’internaute n’aura plus qu’à cliquer sur la petite icône pour lancer la recherche sur des objets similaires. Pour l’instant cela ne fonctionne que sur la version desktop et non mobile.
On sait par ailleurs que Google travaille depuis des années sur la reconnaissance d’objets au sein des images et des vidéos mais il ne propose pas, à l’heure actuelle, de fonctionnalités similaires sur son moteur d’images.
Les réseaux sociaux basés sur l’image : Pinterest, Instagram et Flickr
Les réseaux sociaux dédiés à l’image ont eux aussi investi le champ de la reconnaissance d’objets. Pinterest, bien sûr, dont nous avons déjà parlé mais aussi Flickr.
Flickr est un site de partage de photos (personnelles mais on y trouve également de nombreux photographies faites par professionnels) qui existe depuis 2004 et appartenait à Yahoo (maintenant Verizon). Depuis 2015, Flickr a mis au point un système de reconnaissance automatique de visages, objets, couleurs, etc.
Le moteur interne permet donc désormais d’effectuer des recherches sur des photos, des personnes ou des groupes et de filtrer les résultats par couleur, type de licence, orientation, taille, date et la recherche peut porter sur tout le contenu ou uniquement les tags.
Instagram, autre réseau social de référence pour l’image, ne semble pas avoir investi pour le moment le champ de la recherche visuelle ou de la reconnaissance d’objets. Il reste néanmoins une source d’information importante pour la recherche d’images.
Rappelons qu’Instagram existe depuis 2010 et permet à ses utilisateurs de partager leurs propres photos et vidéos. Contrairement à Pinterest, les utilisateurs ne peuvent pas repartager les contenus des autres utilisateurs. Il n’est pas non plus possible de poster des liens vers des contenus externes.
Le moteur de recherche interne est également très limité.
Autres outils pour la recherche d’images
Au-delà des outils cités précédemment, les autres sources d’informations et outils dédiés à la recherche d’images n’ont pas pris pour le moment le virage de l’intelligence artificielle. Il n’en reste pas moins important de connaître leur existence pour la veille et la recherche d’informations.
Nous avons dressé ici une typologie des outils à prendre à compte.
Les outils satellites
Google occupe également une place importante sur le marché de la recherche d’images satellites avec Google Earth qui existe depuis de très nombreuses années. Dans la même veine, on citera TerraPattern, un outil de recherche d’images satellites qui ne fonctionne malheureusement que sur quelques grandes villes américaines et …Berlin. La société indique cependant vouloir rajouter d’autres villes prochainement.
Il ne faudra pas oublier Google Street View ou Bing Street Side qui permettent de naviguer visuellement dans les rues du monde entier.
Les moteurs d’images libres de droits
Pour la recherche d’images, on ne saurait oublier tous les moteurs spécialisés sur les images libres de droits ou sous licence Creative Commons. Rappelons que les licences Creative Commons permettent de vérifier immédiatement si l’œuvre est diffusable et réutilisable gratuitement et dans quelles conditions.
Parmi ces nombreux outils, on pourra citer :
- CC Search, un métamoteur proposé par Creative Commons : https://ccsearch.creativecommons.org ;
- Everystockphoto : http://www.everystockphoto.com ;
- Unsplash : https://unsplash.com ;
- Pixabay : https://pixabay.com/fr ;
- Pexels : https://www.pexels.com ;
- Splitshire : https://www.splitshire.com ;
- LibreStock : https://librestock.com ;
- Everypixel : https://everypixel.com ;
- Busrt : https://burst.shopify.com.
Les moteurs de photos de stocks
Parallèlement aux outils de recherche d’images libres de droits, on trouve également toute une panoplie de sites, bases de données et moteurs de photos de stocks, c’est à dire d’images réutilisables mais payantes. Le choix d’images est généralement plus large et de meilleure qualité.
On citera :
- 123rf : https://fr.123rf.com
- Depositphotos : https://fr.depositphotos.com
- Fotolia : https://fr.fotolia.com
- Istockphoto : http://www.istockphoto.com/fr
- Shutterstock : https://www.shutterstock.com
- 500px : https://500px.com
Les moteurs de logos et d’infographies
Dans une catégorie un peu à part, on citera également le moteur de logos Instant Logo Search (http://instantlogosearch.com) qui permet de rechercher parmi des milliers de logos, de les télécharger et de les réutiliser gratuitement.
Pour l’aspect visuel, il faudra également penser aux infographies et aux outils permettant d’en identifier sur le Web. On pourra mentionner :
- Daily Infographic : http://www.dailyinfographic.com
- Information is beautiful : http://www.informationisbeautiful.net
- Knoema, un moteur de données et d’infographies : https://knoema.fr
- Statista : un portail de statistiques qui propose également de nombreuses infographies : https://fr.statista.com/graphique-du-jour
Il est également possible de retrouver des infographies en entrant le terme infographie combiné avec les termes de sa recherche dans Google images, Google news ou encore Pinterest.
Bases de données d’images chez les serveurs et bases de données
Certains serveurs et grands fournisseurs d’information payante proposent également des bases de données dédiées à l’image. C’est notamment le cas d’EBSCO.
Chez EBSCO, on citera :
- AP Images Collection, la collection de photographies de l’agence de presse américaine avec plus de 12 millions de photos remontant jusqu’à 1826,
- −Art Museum Image Gallery, un accès aux collections de musées avec plus de 158 000 images (peinture, sculpture, photographies, textiles, etc.),
- Scientific & Medical ART Imagebase, une base de données d’images médicales avec plus de 24 000 illustrations.
Bases de données marques et brevets
Dans le domaine des marques figuratives, la recherche par les images, qui répondait à un vrai besoin, a pris un réel essor il y a quelques années, après quelques tentatives peu concluantes les années précédentes. Par contre, la recherche sur les caractéristiques des images existe depuis longtemps.
On pourra citer :
- https://www.tmdn.org/tmview/welcome.html?lang=fr
- https://euipo.europa.eu/eSearch
- https://trademark.vision
- https://trademark.vision/news/world-first-industrial-designs-image-search--1496296992
- http://ausdesigns.labs.trademark.vision
En ce qui concerne les images figurant dans les brevets, elles sont présentes essentiellement pour illustrer ce qui est précisé dans le texte, de façon très détaillée. La recherche par les images n’est pas vraiment un besoin, d’autant que ces images sont souvent très complexes.
Comme nous avons pu le voir, le champ de la recherche d’images est très vaste et les sources et outils utilisés dépendent grandement du sujet et de la thématique étudiée.
Et c’est sans compter toutes les autres sources et outils non spécifiquement dédiés aux images qui proposent des fonctionnalités pour limiter la recherche aux images...
Les applications à la veille et la recherche
On constate que les principales innovations en matière de recherche visuelle ou de reconnaissance d’objets se concentrent surtout sur les outils grands publics (moteurs de recherche, réseaux sociaux spécialisés sur les images ou encore sites de vente en ligne) même s’ils peuvent également être utilisés dans la sphère professionnelle. Du côté des outils strictement professionnels, les plateformes de veille commencent à proposer des fonctionnalités innovantes en matière de recherche d’images.
Voyons maintenant dans quels cas la recherche visuelle ou d’images peut avoir un intérêt dans un contexte de veille ou de recherche d’informations.
Les images pour le sourcing
Dès la phase de sourcing, la recherche visuelle et d’images pourra représenter un bon moyen de compléter son sourcing. Rappelons que le sourcing est l’étape qui consiste à identifier les sources pertinentes à mettre sous surveillance. Il est l’un des éléments-clés de la mise en place d’un processus de veille.
A partir d’une image tirée d’un article pertinent dans le cadre de sa veille, d’un événement, d’une photo d’une personnalité citée dans la recherche ou la veille, le logo d’une société surveillée, etc., on pourra lancer des recherches dans des moteurs de recherche inversée comme ceux de Google, Bing ou encore TinEye et ainsi repérer des images et extension des pages web traitant d’une thématique similaire. Ces sources pourront ensuite être intégrées au corpus de veille.
E-réputation : marques et personnes
La recherche d’images prend tout son sens dans un contexte de e-réputation qu’elle soit appliquée à des personnes ou à des marques (voir notre article : la recherche d’information appliquée aux personnes : de la simple vérification aux décisions stratégiques - NETSOURCES n°128 - Mai/Juin 2017)
On aura alors intérêt à recourir :
- aux moteurs d’images comme Google, Bing pour voir ce qui ressort à partir d’un nom de personne, de marque ou d’entreprise ;
- aux réseaux sociaux comme Pinterest, Instagram et Flickr ;
- aux moteurs de recherche inversée pour détecter d’éventuelles images, détournées, des montages ou des images publiées à son insu ;
- aux plateformes de veille proposant un système de reconnaissance d’images/de logo pour détecter toutes les références à une marque sans qu’elle soit pour autant citée textuellement (attachement à la marque, informations négatives à propos de la marque, montages et détournements).
Retrouver le nom d’une personne à partir d’une image
Autre cas de figure. Il peut arriver qu’on identifie lors d’une veille ou d’une recherche une personne sur un site Web, un réseau social, etc. sans pour autant disposer de son nom et des informations nécessaires pour la retrouver.
Première possibilité : utiliser les moteurs de recherche inversée pour identifier d’autres pages Web utilisant la même image et susceptibles cette fois-ci de fournir le nom de la personne.
Autre possibilité : analyser en détail l’url de l’image en question pour voir si le nom de la personne n’y est pas indiqué.
Identifier des experts
L’identification d’experts est une problématique bien connue des professionnels de l’information. L’image peut ici aussi jouer un rôle et on pourra tirer parti des outils de recherche visuelle.
On commencera tout d’abord par les moteurs classiques d’images comme ceux de Google ou de Bing. Chez Google images, une fois la recherche lancée, on peut choisir de limiter la recherche aux visages (en sélectionnant type puis visages).
Chez Bing, il n’existe pas de fonctionnalité tout à fait équivalente mais on peut spécifier dans les filtres, dans le cas de personnes, si l’on souhaite limiter aux visages uniquement ou à la tête et épaules. Cela semble permettre de mettre en avant les personnes par rapport aux autres contenus.
Une fois un ou plusieurs experts identifiés, on pourra relancer des recherches sur les noms de ces personnes dans les moteurs d’images pour détecter d’autres personnes gravitant autour de ces personnalités et éventuellement des experts du même sujet.
Contrefaçons / copies
Comme nous le mentionnions précédemment, il existe des platefromes et outils spécialisés dans la détection de contrefaçons. Néanmoins, si l’on ne dispose pas de ces outils, on pourra recourir à des solutions plus artisanales à partir d’outils gratuits :
- les moteurs de recherche inversée pour détecter des produits similaires ;
- les fonctionnalités de recherche visuelle des réseaux sociaux comme Pinterest ;
- les fonctionnalités de recherche visuelle des sites d’e-commerce comme Amazon, Ebay, etc.
Veille et recherche dans un contexte multilingue
On y pense moins mais la recherche d’images peut avoir un intérêt dans le cas d’une recherche d’information multilingue, notamment dans le cas de langues que l’on ne maîtrise pas et qui sont difficiles à rechercher (car n’utilisant pas l’alphabet latin). Nous avions eu l’occasion d’illustrer ce cas il y a plusieurs années dans un article de NETSOURCES intitulé « Repérer les retombées presse d’une exposition grâce aux images » (NETSOURCES n°97 - mars/avril 2012).
Dans ce cas précis, nous avions utilisé l’image de l’affiche de l’exposition dans les moteurs de recherche inversée pour repérer des articles de presse et sites qui en parlaient. Cela nous avait permis d’identifier des articles en japonais ou en chinois qui n’auraient pas pu être retrouvés de manière textuelle, même si des noms de marques ou d’entreprises figurent en caractères latins dans ces articles.
Cette méthode peut s’appliquer à toutes sortes de veilles ou de recherches à condition de disposer d’une image suffisamment distinctive.
Veille concurrentielle & innovation
Bien que ce ne soit pas toujours évident, les images ont toute leur place dans un processus de veille concurrentielle et d’innovation.
Comme nous avons pu le voir précédemment, une photo de produit, de dirigeant, etc. peut permettre de lancer une recherche d’images similaires et par là-même de détecter des informations concurrentielles.
On pourra également penser aux outils satellites présentés précédemment pour analyser les sites de production de concurrents (voir notre article « Veille concurrentielle dans l’Industrie : la cas des usines » - NETSOURCES n°126 - janvier/février 2017).
Enfin les réseaux sociaux d’images comme Pinterest pourront être un moyen de détecter de nouveaux produits innovants.
Veille et recherche scientifique et technique
Cette préoccupation de recherche sur les images n’est pas nouvelle. En effet, Cambridge Scientific Abstracts avait lancé en 2007 le produit CSA Illustrata, qui indexait les légendes des illustrations des articles scientifiques, ouvrant ainsi de nouvelles possibilités de recherche. Proquest, qui a racheté CSA, a annoncé l’arrêt du produit en 2016.
Par ailleurs, Springer Images avait été arrêté en mai 2014. D’autre part, dans le domaine de la chimie, les recherches sur les structures (leurs dessins) offrent toujours plus de possibilités.
Vérifier la véracité d’une information
Au-delà de la phase de collecte, l’image peut jouer un rôle dans la vérification de l’information. Lorsque l’information provient d’une source inconnue ou douteuse, les images qui y sont présentes permettront d’obtenir des indices quant à la véracité de la l’information. En effet, si l’image est truquée ou ne correspond pas aux faits présentés dans un article, il est fort probable que toute l’information présentée soit à prendre avec précautions. En cette période où l’on parle quotidiennement des fake news, ces quelques éléments de méthode pourront être utiles.
On pourra ainsi utiliser les outils de recherche inversée pour vérifier si l’image n’est pas utilisée sur d’autres pages et sites (et s’il ne s’agit pas de photos de stocks), les outils d’images satellites pour vérifier si la localisation indiquée correspond bien à la réalité.
Enfin on pourra utiliser des outils comme Findexif.com (qui permet d’extraire les données Exif d’une photo comme la date de prise de vue, et d’identifier avec quel appareil elle a été prise, etc.) ou Foto Forensics, un site qui détecte les anomalies d’une photo et permet ainsi de repérer des montages.
Illustrer ses livrables
Enfin l’image pourra servir au moment de la phase de diffusion d’une veille car, n’oublions pas qu’« une image vaut mieux que mille mots ».
C’est à ce stade que les moteurs d’images libres de droit, les moteurs de photos de stock ou les moteurs de logo ou infographies trouveront leur utilité.
Conclusion
Même si le lien entre veille concurrentielle et stratégique et contenus visuels n’est pas toujours des plus évidents, la prise en compte de l’image dans le processus n’est pas à négliger.
Cependant, on constate que la majorité des innovations quant à la recherche visuelle et d’images liées au développement de l’intelligence artificielle s’applique pour le moment principalement à des outils et applications grands publics.
L’introduction dans la sphère professionnelle n’en est qu’à ses balbutiements. Il faudra donc suivre ce secteur avec intérêt dans les prochaines années...