Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.
Le développement du mouvement de la science ouverte (open access mais aussi open citations) donne un coup de projecteur aux citations et références, ainsi qu’à leur rôle dans le processus de recherche d’informations et de veille.
De nombreux outils s’emparent de ces données, désormais accessibles librement, pour proposer des fonctionnalités de recherche spécifiques et on voit également l’apparition de nombreux petits outils, souvent gratuits, qui se donnent pour mission d’explorer les réseaux de citations, offrant une autre manière de rechercher des documents pertinents et/ou d’identifier des experts.
On trouve aussi les citations dans les brevets. Et même si elles sont librement accessibles depuis longtemps, la recherche par les citations reste un champ trop peu exploré lors d’une recherche brevets.
Lire aussi :
Le brevet est-il un signal faible pour l'innovation ? (10/2022)
Savoir utiliser les publications défensives dans une stratégie brevet (05/2022)
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise (03/2022)
La recherche de citations et de références boostée par l’IA et les « open citations »
On a pu assister ces dernières années à des progrès spectaculaires dans le traitement et l’exploitation des données : traitement du langage, analyse sémantique, réseaux de neurones ou IA, pour n’en citer que quelques-uns. Le monde du brevet n’échappe pas à cette tendance, et on a pu voir au cours des dernières années plusieurs initiatives dans les domaines de la traduction, de la classification automatisée ou de la recherche.
IPRally dont nous avons eu l’occasion de parler en détail dans le n° 395 de BASES de septembre 2021 est d’ailleurs un exemple concret de l’application de ces nouvelles technologies au service de la recherche dans les bases de données.
Sur quelles thématiques travaillent aujourd’hui les spécialistes du domaine ? Quelles futures révolutions nous attendent dans les années à venir pour la veille et la recherche d’information brevet ?
C’est ce que nous avons essayé de déterminer dans cet article avec une approche qui nous a paru originale : aller regarder dans les brevets eux-mêmes «ce qui les attend» à plus ou moins long terme - autrement dit , essayer de lire l’avenir du brevet en tant qu’objet d’innovation dans les brevets eux-mêmes.
Lire aussi :
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise
Nous avons testé IPRally, l'outil qui veut révolutionner la recherche brevets avec de l'IA
Espacenet, un acteur clé en mutation
The Lens, un outsider au fort potentiel pour la recherche brevet gratuite
Les publications défensives sont nées à la toute fin des années 1950, c’est-à-dire avant l’apparition des banques de données brevets et même des banques de données tout court.
On les appelle aussi « defensive publications », « technical disclosures » ou encore « defensive disclosures » en anglais.
Il était alors beaucoup plus difficile qu’aujourd’hui de trouver de l’art antérieur (prior art en anglais) qui n’était disponible que sous forme papier.
Cette notion d’art antérieur fait référence aux informations et documents publiés antérieurement au dépôt d’un brevet, connus du public en général et qui peuvent affecter de près ou de loin la « brevetabilité » d’une invention.
Lire aussi :
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise
Minesoft change d’échelle
OMPI (Organisation Mondiale de la Propriété Intellectuelle) met en ligne des "Patent Landscapes"
Nous avons testé IPRally, l'outil qui veut révolutionner la recherche brevets avec de l'IA
Selon un « mantra » communément trouvé dans la littérature spécialisée, « 80 % de l’information technique trouvée dans les brevets n’est pas présente ailleurs ».
L’information brevet renseigne en premier lieu sur l’évolution des technologies, et sur l’état de l’art, où l’état de la technique dirait un examinateur. Une proportion très importante des documents cités dans les rapports de recherche produits par l’OEB (Office Européen des Brevets) correspond à de la littérature brevet, ce qui souligne l’importance de l’information brevet dans une étude de brevetabilité.
L’INPI (L’Institut National de la Propriété Intellectuelle), au début des années 1980, avait lancé une publication dénommée « Le clignotant des technologies », dont la production était confiée à un service particulier, le RISC, pour « Recherche en Information Stratégique et Concurrentielle ».
Stratégie et concurrence : nous y voilà. En fournissant une visibilité sur l’orientation des axes de R&D des concurrents, l’information brevet constitue une aide à la définition d’une stratégie d’entreprise.
Lire aussi :
OMPI (Organisation Mondiale de la Propriété Intellectuelle) met en ligne des "Patent Landscapes"
Nous avons testé IPRally, l'outil qui veut révolutionner la recherche brevets avec de l'IA
Nous avions présenté le portail DATA INPI dans le numéro 378 (février 2020) de BASES.
Jusqu’à maintenant, l’outil se positionnait uniquement sur l’aspect recherche d’information. Depuis peu, il permet également de faire de la veille.
On peut désormais mettre en place, toujours gratuitement, un maximum de 10 alertes simultanément sur une entreprise, une marque, un brevet, un dessin/modèle.
Les résultats des alertes sont envoyés chaque vendredi par courriel.
Lire aussi :
Créée en 1996, Minesoft était quasiment une entreprise familiale, ce qui ne l'a pas empêchée de se développer sur le marché de la PI (propriété intellectuelle) et d’atteindre un chiffre d’affaires de près de 20 millions d’euros.
Connu pour sa banque de données de recherche de brevets Patbase, utilisée dans de nombreux pays et en particulier en France, Minesoft a développé différents logiciels pour accompagner cette banque de données.
Minesoft vient d’être racheté par MLM 2, une plateforme d’information et de logiciels créée en partenariat avec Warburg Pincus, une importante société de private equity qui gère 73 milliards d’assets répartis dans 235 sociétés très diversifiées.
Minesoft est la première acquisition de MLM 2 dont l’objectif est, par d’autres acquisitions, de devenir un leader dans les logiciels et le service de propriété intellectuelle.
Lire aussi :
Généralisation de la reconnaissance automatique des éléments chimiques dans les textes
Minesoft/Patbase lance Chemical Explorer
Les banques de données brevets gratuites ou freemium
À l’occasion de la journée des utilisateurs qui s’est déroulée en distanciel, Covid oblige, STN a présenté plusieurs nouveautés de différente nature.
Et le moins que l’on puisse dire, c’est que STN continue à enrichir son offre, que ce soit au niveau de la couverture ou des fonctionnalités.
Une nouvelle base de données a été chargée qui a pour nom Russian Patents Full-Text (RUFULL). Elle propose le texte intégral en anglais des demandes de brevets, des brevets délivrés ainsi que des modèles d’utilité publiés par :
Lire aussi :
STN enrichit la recherche sur les valeurs numériques
Dialog devient une source pour l’open access avec la base Publicly Available Content
The Lens, un outsider au fort potentiel pour la recherche brevet gratuite
Les "patent landscapes" sont des études détaillées d'un domaine technologique relativement précis comme, par exemple les technologies relatives au micro algues, la production d'huile de palme et les technologies de traitement des déchets ou l'industrie pharmaceutique australienne.
Ces études sont réalisées à partir d'un corpus de brevets pertinents qui sont analysés de multiples façons avec un grand nombre de représentations visuelles dont les fameux paysages fait de montagnes et de vallées.
On pourra trouver ces "patent landscapes" sur le site de l’OMPI.
Auteur : François Libmann, Directeur de publication
L’OMPI (Office mondial de la propriété intellectuelle) offre sous le nom d’INSPIRE un recensement de 35 bases de données brevets disponibles dans le monde dont quelques sites d’offices de brevets (européen, japonais, coréen, russe, OMPI).
Cependant, on ne trouve pas, par exemple, les sites français, américain ou australien, sachant que les offices sont nombreux à proposer une recherche dans leurs collections. On ne trouve pas non plus Google Patent. Cela dit, la liste n’est pas close.
Lire aussi :
Nous avons testé IPRally, l'outil qui veut révolutionner la recherche brevets avec de l'IA
The Lens, un outsider au fort potentiel pour la recherche brevet gratuite
17 critères permettent d'affiner la sélection des bases.
On peut, par exemple, sélectionner les systèmes gratuits (au nombre de 14 sur les 35) ou la possibilité de faire des troncatures à droite, à gauche, au milieu ou des deux côtés (12 sites le permettent) de disposer de la troncature illimitée (dans 20 sites). On peut aussi choisir parmi sept possibilités de recherches sur les structures chimiques.
Questel est, depuis plusieurs années, une société en fort développement.
En effet, si, en avril 2015, elle comptait environ 140 salariés, 3 000 clients et 100 000 utilisateurs, en mars ces chiffres sont devenus 1 400 salariés, 15 000 clients et plus de 1,5 million d’utilisateurs.
Cette croissance importante est due pour une bonne part à l’acquisition d’un grand nombre de sociétés offrant des produits et/ou des services dans le domaine de la propriété intellectuelle (voir notre article « Questel double sa taille avec plusieurs acquisitions en 2021» dans ce même numéro).
L’ensemble de ces acquisitions a été réalisé avec le soutien de fonds de Private Equity.
Ce souci de développement ne pouvait, bien sûr, mettre de côté l’utilisation de l’intelligence artificielle.
Lire aussi :
Brevets : les évolutions d’Orbit
Les "combination sets" dans la classification des brevet
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip
Questel multiplie les acquisitions depuis des années déjà. En effet, durant ces cinq dernières années pas moins de quinze ont été réalisées.
Les dernières acquisitions ont permis à Questel de doubler sa taille.
Questel vient d’annoncer le bouclage de l’acquisition de NovumIP, groupe mondial de technologies, résultat de la fusion des sociétés Pavis et Novagraaf.
Questel vient aussi de finaliser le rachat de la minorité restante des actions de la société allemande Brandstock, fondée en 1993, qui propose un ensemble de services, en particulier juridiques, ainsi que sur la transparence des coûts des prestations dans le domaine de la propriété intellectuelle.
Lire aussi :
Brevets : les évolutions d’Orbit
Les "combination sets" dans la classification des brevet
Contentieux de brevets et marques : Clarivate Analytics rachète darts-ip
IA, deep learning, recherche sémantique, classification automatique : ces termes sont de plus en plus fréquents dans le monde des bases de données brevets.
Vont-ils renvoyer les tenants de la recherche traditionnelle au rayon des archives du monde des professionnels de l’information brevet ? Les codes CIB, CPC, les mots-clés représenteront-ils bientôt des techniques démodées à remiser au placard ? Qui sont ces nouveaux outils et condamnent-ils réellement des techniques éprouvées depuis plusieurs dizaines d’années, ou au contraire ne font-ils que les complémenter ? Enfin, quel est leur niveau de performance et comment les utilise-t-on ?
Les informations ici présentées résultent également d’un échange avec les équipes d’IPRally.
The Lens est un moteur de recherche lancé en 2000 par une organisation à but non lucratif, Cambia, basée au sein de l’Université de Technologie du Queensland à Brisbane en Australie.
Particularité distinctive, il donne accès à trois bases de données, dont une base de publications scientifiques, objet de l’article de François Libmann dans ce même numéro « The Lens pour la littérature scientifique : des contenus mal valorisés », une base de séquences et une base de données brevets en accès libre. Cette dernière est l’objet de cet article.
Les fusions/acquisitions sont depuis longtemps très fréquentes dans le domaine de l’information.
Près de nous, voici des années que Questel rachète des sociétés, en France comme à l’étranger, offrant divers services liés à la propriété intellectuelle, cœur de son activité. Dans un autre domaine, Cision a acheté il y a quelques années Europresse, l’Argus de la Presse et PR Newswire. Cette situation existe aussi aux Etats-Unis.
Aujourd’hui, il s’agit d’un achat important d’un acteur essentiellement privé, en l’occurrence Proquest par l’acteur public qu’est Clarivate. La transaction s’élève à 5,3 milliards de dollars, dont quatre en liquide et 1,3 en actions.
Qui ne connait pas Espacenet. Lors de son lancement en 1998 par l’OEB, ce service mettant gratuitement à disposition de tous l’information brevet via une interface web très intuitive a été vécu comme une révolution par les habitués des langages d’interrogation des Questel et autre STN.
Espacenet a incontestablement représenté une sorte de démocratisation de l’accès au contenu des brevets. Pour ceux dont le métier consiste à sensibiliser les PME à la propriété industrielle, Espacenet a aussi constitué, par son côté ludique pour l’« homme de la technique », un excellent moyen d’attirer vers cette matière ardue un public qui y est souvent rétif.
23 ans après ses débuts, et malgré le développement de nombreux outils équivalents, Espacenet reste une référence parmi les produits en accès libre.
Le lancement en octobre 2019 d’une nouvelle version constitue un tournant important dans l’histoire de ce service.
Présentation de l'auteur : Philippe Borne est depuis plus de 30 ans engagé dans les métiers de la propriété industrielle au sein de l’INPI. Il y a commencé ses activités en relation avec le projet Pharmsearch/MMS (Merged Markush Service) , une base de données couvrant les brevets des domaines de la chimie et de la pharmacie résultat d’un projet mené conjointement par Questel, Derwent en l’INPI. Il a, à ce titre, été en contact avec de nombreux professionnels et utilisateurs de l’information brevet avec lesquels il reste en lien, notamment en tant que membre du CFIB (Club Francophone d’Information Brevet).
Quand on aborde un sujet, les brevets sont une source analogue à la littérature scientifique pour découvrir un domaine scientifique, car les brevets ne sont pas seulement une source de protection mais aussi une source d’information très large et riche.
Traditionnellement, les recherches brevet étaient et sont toujours menées par des ingénieurs spécialisés. Avec le développement des outils gratuits et freemium, ces recherches sont maintenant à la portée de tout ou un chacun, tout au moins ayant un intérêt fort sur un sujet technologique. C’est à leur attention que nous avons rédigé cet article, afin de leur donner des outils et meilleures chances de succès.
Lors d’une démarche de développement technologique, il est important de ne pas négliger les titres de propriété intellectuelle. Les principaux sont les brevets et les marques dont nous parlerons ici, mais il faut savoir qu’il existe aussi les dessins et modèles de même que les droits d’auteurs ou les indications géographiques.
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
De la référence bibliographique au texte intégral des articles scientifiques, il n’y a pas toujours qu’un pas
La veille au défi de l’information scientifique et technique
Il existe, ou il a existé, plusieurs classifications de brevets reposant sur les éléments constitutifs de chaque brevet.
La plus récente est la Classification Coopérative des brevets (CPC) qui est une extension de la Classification Internationale des Brevets (CIB), créée par l’Arrangement de Strasbourg de 1971, qui est un système hiérarchique de classement des brevets selon les différents domaines technologiques auxquels ils appartiennent.
Cette nouvelle classification des brevets est gérée conjointement par l’Office Européen des Brevets (OEB) et l’United States Patent and Trademark Office (USPTO) et intègre les meilleures pratiques de classification des deux offices. Sa création a été initiée en 1990 par un accord entre les deux offices et elle a été mise à disposition au début de 2003.
Data.inpi.fr propose des données sur les entreprises issues du Registre National du Commerce et des Sociétés.
Cette base vient rejoindre les autres bases de données gratuites déjà disponibles, proposées par l’INPI sur :
les marques françaises, de l’Union Européenne et internationales ;
les brevets français, européens et internationaux ;
les dessins et modèles français et internationaux ;
darts-ip est un produit à la fois original et intéressant qui indexe de façon très fine et la plus exhaustive possible la jurisprudence en matière de propriété intellectuelle.
Aujourd’hui plus de cinq millions de documents sont disponibles, concernant des litiges et même de simples poursuites dans les domaines des brevets (1,6 million d’affaires), marques (3,2 millions d’affaires), dessins et modèles (108 000 affaires), noms de domaines (136 000 affaires), copyright (156 000 affaires) et concurrence déloyale couvrant aujourd’hui le monde entier.
Lire aussi :
darts-ip : croissance et changement de politique
BASES n°294, juin 2012 : à commander en direct en nous écrivant à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
La recherche dans les brevets en texte intégral, comme d’ailleurs dans le texte intégral de n’importe quel document, n’est pas toujours évidente.
En effet, se limiter aux champs titre ou abstract ou revendications (ces dernières dans le cas des brevets) peut être un petit peu restrictif, mais inclure l’ensemble de la description générera, en général, du bruit.
STN propose maintenant pour ces banques de données un nouveau champ baptisé Key Terms (KT).
Lors de la récente journée annuelle du CFIB (Club Francophone de l’Information Brevet), Philippe Bodart (TOTAL Research & Technology, Feluy-CFIB) a fait part de sa découverte de la « dégringolade » du nombre de références d’articles écrits en chinois, donc a priori d’auteurs chinois, dans la Chemical Abstracts.
Nous avons décidé d’approfondir le sujet de cette tendance inquiétante et cet article est le résultat de nos investigations et de nos échanges.
Tout d'abord, nous avons effectué des comptages, non seulement dans Chemical Abstracts, mais aussi dans d’autres banques de données et dans d’autres langues asiatiques pour voir si le problème était limité aux articles écrits en chinois pour Chemical Abstracts ou s'il était beaucoup plus large.
Dans le numéro 294 de BASES daté de juin 2012, nous avions eu l’occasion de consacrer un article à un produit très original baptisé darts-ip qui réunissait les décisions concernant les litiges en matière de propriété intellectuelle.
Cette banque de données offrait de la jurisprudence en matière de brevets, marques, dessins et modèles ainsi que noms de domaine. Un logiciel spécifique adapté à la matière avait également été développé permettant d’effectuer un grand nombre de recherches spécifiques.
Lire aussi : Clarivate Analytics rachète darts-ip
Marie-Pierre Vidonne du CFIB (Club francophone de l’information brevet) a attiré notre attention sur le lancement récent de la banque de données Pat-INFORMED (Patent Information Initiative for medicines).
Cette banque de données propose des informations sur 14 000 brevets délivrés (uniquement, c’est-à-dire sans références de demandes en cours) issus de 600 familles correspondant à 159 produits différents identifiés par leurs DCI (Dénomination commune internationale, communément appelée « nom générique », ou INN en anglais pour International Nonproprietary Name).
Ces termes sont enregistrés auprès de l’OMS (Organisation Mondiale de la Santé). Il en existe aujourd’hui plus de 8 000.
On sait que l’offre en matière de banques de données brevets est assez pléthorique. Cela reflète d’abord l’évolution des technologies rendant plus facile la création d’une offre sophistiquée. Cette évolution coïncide avec l’importance croissante de l’intérêt pour les brevets pour un grand nombre d’entreprises, de la start-up à la multinationale en passant par les laboratoires publics en mal de valorisation. Un élément facilitant est que ces informations sont a priori gratuites et ne font pas l’objet d’un copyright.
En revanche, la demande croissante de la traduction en anglais des brevets de plus en plus nombreux déposés dans des langues « exotiques », en particulier asiatiques, et n’ayant pas d’équivalent en anglais, génère des coûts non négligeables. Cela est d’autant plus vrai que l’évolution rapide des logiciels de traduction oblige à refaire assez souvent, en les améliorant, les traductions d’une langue essentiellement vers l’anglais. Néanmoins, dans certains cas, les traductions sont disponibles gratuitement.
Après le léger passage à vide observé lors de l’abandon du développement de New STN, STN montre un regain de dynamisme et, lors de la dernière journée d’utilisateurs, les nouveautés ne manquaient pas.
Il faut d’abord savoir que tous les nouveaux développements et les ajouts de nouvelles bases se feront sur STNext.
Pour leur part, New STN et STN Express continueront à exister mais ne bénéficieront d’aucune nouvelle fonctionnalité et seront abandonnés à terme
Depuis plus d’un an maintenant, l’intelligence artificielle (IA) est au cœur de l’actualité et des discussions professionnelles. Mais s’il est beaucoup question d’IA et de machine learning, appliqués aux moteurs de recherche grand public, aux outils de traduction ou encore aux outils de veille, elle se fait plus discrète pour tout ce qui a trait à l’information scientifique et technique et les brevets. Et pourtant, elle y est bien présente et mérite qu’on s’y intéresse.
Lors de la dernière réunion annuelle du CFIB, le Club Francophone de l’Information Brevet, elle a d’ailleurs été au centre des discussions. L’une des présentations consacrée à l’intelligence artificielle et la propriété intellectuelle a ensuite fait l’objet d’un article très intéressant dans la lettre du CFIB.
La première édition de IC-SDV née de la fusion des manifestations ICIC et II-SDV organisées par Christoph Haxel vient d’avoir lieu à Nice, incontestablement plus facile d’accès qu’Heidelberg, mais peu accueillante.
On a retrouvé le format et les caractéristiques des deux manifestations qui avaient fusionné avec légèrement plus de monde, ce qui est logique. Nous avons également remarqué une plus grande fluidité dans les échanges entre les congressistes à leur grande satisfaction.
On pouvait craindre que, comme l’intelligence artificielle est à la mode, la manifestation serait centrée sur l’IA. Ce ne fut heureusement pas le cas même si ce concept était souvent présent en filigrane dans les différentes thématiques abordées lors du congrès. Par ailleurs il y a suffisamment d’autres manifestations qui lui sont spécifiquement consacrées.
Les plateformes de recherche d’art antérieur en matière de brevets ne manquent pas, qu’elles soient payantes ou gratuites, mais la plupart ne proposent que des informations sur les brevets déposés dans la plupart des offices de brevet dans le monde et dans la très grande majorité des cas, il n’y a pas de contenu non brevet (NPL pour Non Patent Literature), sauf éventuellement dans les références citées qui peuvent parfois servir de clés de recherche ( par exemple préfixe /REF qui n’est pas dans le menu déroulant dans Orbit).
Bien sûr, cette littérature non brevet est par ailleurs largement accessible sur certains serveurs de littérature scientifique et technique comme Proquest Dialog ou STN, mais il n’y a pas vraiment d’intégration entre les deux types d’information même si l’on peut utiliser le même langage de requête sur la même plateforme.
La réunion parisienne des utilisateurs d’Orbit a été l’occasion de faire le point sur les nouveautés déjà opérationnelles ou proches de leur mise à disposition.
Une première tendance a été fortement mise en avant, qui est celle des différentes analyses possibles des résultats en fonction d’une multitude de critères avec toujours plus d’options de visualisation, en particulier de coloriage pour une analyse plus facile.
Si l’on a souscrit à l’option Platinum, on dispose même de près d’une vingtaine de graphes prédéfinis, avec, parmi eux, un graphe indiquant les dépenses brevets d’un ensemble de sociétés.
Lighthouse IP est une société néerlandaise créée en 2006 ayant de nombreux bureaux dans le monde. Son objectif est d’être la plus exhaustive possible dans le recensement de l’information sur les brevets et les marques.
En matière de brevets, Lighthouse IP couvre en texte intégral plus de 65 offices dans le monde. Ce texte intégral est dans la langue d’origine accompagné de traductions machine en anglais. Les deux versions sont « recherchables ».
La couverture inclut, en particulier, l’essentiel des offices asiatiques et sud américains.