Quantalyze.com : une autre façon de chercher les valeurs numériques dans les brevets

La recherche, dans le texte des brevets, de données numériques d’une valeur précise ou comprise dans un intervalle donné, répond clairement à un besoin pour certaines recherches.

Nous avons déjà parlé de l’offre de STN – actuellement disponible dans les banques de données de brevets PCT, australiens et canadiens (voir Bases n°280, mars 2011) – et Capadoc nous a proposé dans ces colonnes un exemple d’utilisation (voir Bases n°285, septembre 2011).
Quantalyze, dont le nom a été formé à partir des mots quantities and analyse, permet également ce genre de recherche, mais avec un principe de fonctionnement très différent.

Quantalyze est proposé par la société autrichienne max.recall, créée en 2010.

Rappelons que sur STN, on entre une équation de recherche et le système renvoie comme réponse les brevets dans le texte desquels on trouve les valeurs numériques cherchées – éventuellement  combinées avec d’autres critères de recherche.

Dans Quantalyse, on débute la recherche en choisissant un ensemble de brevets par leur numéro (jusqu’à 5 000 en standard, plus sur demande spécifique).

Une fois les numéros de brevets saisis, Quantalyze accède à l’Open Patent Service (OPS) de l’OEB et aux brevets américains sur Google.

L’OPS fournit les descriptions et revendications pour les documents EP, WO (uniquement si elles sont en anglais, en français ou en allemand), autrichiens et suisses.

Pour les brevets canadiens, seules les revendications sont fournies. Quant aux brevets américains, les brevets délivrés sont disponibles depuis janvier 2005 et les demandes depuis janvier 2003.

Une fois la sélection de brevets effectuée et chargée sur Quantalyze, on

dispose de plusieurs fenêtres.

Dans la première, on a la liste des brevets avec un brevet par ligne : n° de publication, titre, déposant, date de publication, numéro de priorité et date de priorité.

En dessous, on trouve sur la gauche le texte complet du brevet sélectionné s’il est disponible, sinon l’abstract, que l’on peut faire défiler, avec les différentes valeurs numériques surlignées d’une couleur variant selon la valeur.

Sur la droite, on trouve le nombre d’occurrences pour chaque type de valeur numérique : proportion, pourcentage de masse, durée, température…

Un clic sur le nom d’une de ces propriétés fait apparaître la/les ligne(s) du brevet dans laquelle elle figure.

Les grandeurs prises en compte par Quantalyze sont : longueur, durée, température, molécules (quantité de substance), volume, masse, intensité électrique, intensité lumineuse, fraction de molécule, fraction de masse, fraction de volume, dans des quantités de systèmes de mesure avec tous les ordres de grandeurs possibles de Yotta (1024) à Yocto (10-24).

Le nombre de grandeurs prises en compte par STN est bien supérieur, puisqu’il y en a 35 avec, par exemple, la pression, la viscosité, la radioactivité ou le voltage.

Pour pouvoir faire la recherche dans Quantalyze sur les valeurs numériques, il est indispen-sable de passer en plein écran (touche F11 sur un PC), ce qui n’est pas très intuitif ; sinon, les lignes permettant de définir les paramètres n’apparaissent pas ! On peut, dans la recherche, combiner des termes et plusieurs valeurs numériques.

Nous avons fait une première comparaison à partir d’une recherche effectuée dans la base PCTFull de STN.

La stratégie consistait à retrouver les brevets dans lesquels le terme «melting point» se trouvait à dix mots maximum d’une température, comprise dans l’intervalle 300-450°F (ce qui correspond à 148,89°C à 232,22°C), le tout dans les revendications.

Nous avons retenu les six premières réponses (sur 815), dont nous avons entré les numéros dans Quantalyze.

Nous avons ensuite effectué la même recherche dans Quantalyze en demandant que le mot melting figure dans le contexte. Cela signifie aujourd’hui une fenêtre de 200 caractères. A terme, cela signifiera «dans la même phrase».

Sur les six brevets, nous n’en avons retrouvé que trois.

En ce qui concerne le premier, il était trop récent car il ne se trouvait pas encore dans OPS ni, d’ailleurs, dans Espacenet.

Quant aux deux autres, il s’agissait de brevets PCT d’origine japonaise et l’OEB ne propose alors que le résumé en anglais et une recherche sur les revendications ne donne donc rien, même si pour un des brevets on trouvait la propriété recherchée dans l’abstract. PCTFull offre en revanche le texte complet en anglais, obtenu par traduction machine et saisie par OCR.

Nous avons fait une comparaison «dans l’autre sens» en sélectionnant, dans l’échantillon de 549 brevets disponibles sur la page http://demo.quantalyze.com, les brevets dans lesquels on trouvait une longueur de 1mm à 1 cm à proximité du terme size et publiés en 2010.

Nous en avons trouvé quinze, que nous avons retrouvés dans PCTFull, sachant que 14 ont été retrouvés avec une proximité de 10 mots et le 15ème avec une proximité de 20 mots. 

En fait, dans ce quinzième brevet, le terme size était bien à moins de dix mots. Le petit problème était dû à un mauvais positionnement du «highligh-ting», car le texte est saisi par OCR, ce qui entraîne parfois quelques difficultés d’interprétation.

Pour en revenir à Quantalyze, il s’agit bien d’un logiciel et non d’une base de données, logiciel qui peut s’appliquer à d’autres types de sources que les brevets et peut aussi être implanté en lien avec une banque de données « In House ».

POUR EN SAVOIR PLUS

www.quantalize.com


François Libmann
Publié dans le n° 288 de Bases (Décembre 2011)

Aucun commentaire:

Enregistrer un commentaire