ImageNet classe le Net


Le projet ImageNet a été inspiré par un sentiment grandissant au sein de la communauté de chercheurs des universités de Princeton et de Stanford : ils avaient un besoin grandissant de données visuelles.

Grâce à une collabo-ration entre ces deux universités américaines, ImageNet a été créée avec pour objectif de fournir des images aux chercheurs et éducateurs du monde entier, depuis une banque d’images à grande échelle.

Cette base est construite sur la WordNet hierachy, base lexicale de langue anglaise conçue par l’université de Princeton. Ce thésaurus réunit les noms, adjectifs, verbes et adverbes au sein de groupes de mots sémantiquement proches appelés «synsets» ou «synonym sets». La base en possède plus de 100 000.

ImageNet utilise cette base comme structure pour l’indexation des images. Elle n’utilise cependant que les noms proposés par WordNet hierarchy, ce qui représente plus de 80 000 synsets.

ImageNet a pour objectif d’illustrer chaque synset par 1 000 images en moyenne, susceptibles de le qualifier. Elle entend ainsi offrir des millions d’images classées proprement pour la plupart des concepts sémantiques de la WordNet hierachy. ImageNet constitue à ce titre une ressource précise et rigoureuse, qui s’avère utile et importante pour ses utilisateurs.

Les images de cette base sont celles du Net. L’indexation est vérifiée et corrigée par une équipe éditoriale, pour chaque image de chaque synset.

Jusqu’à présent, plus de 14 millions d’images illustrent près de 22 000 synsets.

Mais regardons de plus près ce que cette base propose.

La page d’accueil est constituée d’une simple zone de saisie pour la recherche.

La requête doit se faire impérativement en anglais et ne peut être complexe ; la base se construit en effet sur la structure d’un thésaurus fixe en langue anglaise.

Il faut donc saisir un mot ou un groupe de mots, qui appartiennent à la structure.

Nous avons lancé une recherche avec le mot «dog».

La page de résultats affiche la liste des concepts contenant ce mot, avec pour chacun trois images, puis le nom du synset et les éventuels synonymes, une brève définition, le pourcentage de popularité et la «profondeur» au sein de la WordNet hierarchy (thesaurus).

La requête avec «dog» affiche ainsi 61 synsets, dont «hot dog», «dog food», «water dog», «domestic dog», «wild dog», etc.

Les concepts peuvent être classés par popularité (de 91% à 6% dans notre exemple), ou par profondeur (de 6 à 13 dans notre exemple).

Mais aucune indication n’est donnée sur la façon dont est calculée la popularité.

Lorsqu’un synset correspond à notre attente, il suffit de cliquer sur son nom.

En cliquant sur «domestic dog», on affiche une nouvelle page contenant sur la gauche l’arborescence de WordNet positionnée sur le concept choisi et, dans la partie centrale de l’écran, une multitude d’images, surmontéede trois onglets.

Le premier onglet, baptisé «Treemap Visualization», nous apprend que les images correspondent en fait au synset choisis et aux termes classés sous ce concept dans la structure WordNet. 

Pour «domestic dog» par exemple, on trouve des images concernant les termes «working dog», «hunting dog», «dalmatian», «puppy», etc. (voir écran page 6).

On ne peut à ce stade choisir une image, mais seulement un concept.

Un deuxième onglet, baptisé «Images of the Synset», affiche uniquement les images du concept choisi en premier lieu. Il est possible à chaque image proposée de donner son avis, en indiquant si elle correspond typiquement au concept choisi («Typical») ou non («Wrong»).

Le troisième onglet enfin concerne les téléchargements possibles d’une image («Downloads»).

Attention, ImageNet n’est pas propriétaire des images. Il n’est pas possible d’acheter ou même de copier de façon légale les images affichées. La base ne fournit que des vignettes et propose, via le troisième onglet, de télécharger les URLs des vignettes.

L’utilisateur devra ensuite rechercher les droits d’auteurs liés, surtout pour un usage commercial.

Lorsque les images doivent être utilisées dans un but éducatif ou de recherche, et non commercial, l’utilisateur a la possibilité, après ouverture d’un compte, de télécharger les images pour les utiliser, après avoir signé un contrat avec ImageNet dans lequel il s’engage à respecter ces conditions.

ImageNet parcourt le Net comme un moteur de recherche classique. Sa valeur ajoutée est le classement de ces images dans un thésaurus et en ce sens, elle se place comme une base de connaissances.

http://image-net.org



Christelle Boizeau
Publié dans le n° 300 de Bases (Janvier 2013)

Aucun commentaire:

Enregistrer un commentaire