L'accès aux brevets chinois

-->
L’accès aux brevets chinois est une préoccupation croissante pour la plupart de ceux qui sont concernés par la propriété industrielle.
             
On connaît, d’une façon générale, le développement extrêmement rapide de la Chine. Malgré le ralentissement actuel dû à la crise, son économie, d’abord basée uniquement sur la production de biens matériels à bas coût, s’appuie maintenant de plus en plus sur les résultats de la recherche et de l’innovation.
             
En tout état de cause, il devient difficile – voire impossible – d’ignorer les brevets chinois, dont le nombre connaît un développement particulièrement important.
             
On en donnera deux illustrations.

- la première est issue de la présentation de Questel, lors du dernier salon i-expo : le nombre de dépôts PCT d’origine chinoise a crû de 38,1 % de 2006 à 2007, ce qui représente la plus forte croissante pour tous les pays d’origine des brevets PCT, et représente 3,5 % du total ; si l’on compare avec 2003, la croissance est de 321 % ;

- d’autre part, selon le Thomson Scientific’s World IP Today Global Patent Activity Report (1997-2006), l’“activité brevet” en Chine a augmenté de 470 % depuis 1997, ce qui est du même ordre de grandeur. Irène Schellner, spécialiste à l’OEB de Vienne des brevets asiatiques, a pour sa part indiqué lors de la conférence ICIC d’octobre dernier, que les demandes “domestiques” de brevets chinois avaient été multipliées par 12, entre 1997 et 2007.
             
Nous nous limiterons ici à la République Populaire de Chine, sans prendre en compte Taïwan ni Hong Kong.
            
Nous nous intéresserons essentiellement à la recherche des brevets, qui s’effectue généralement sur les données bibliographiques en anglais, comprenant souvent le résumé et, parfois, la première revendication. Selon les cas, la traduction est faite de façon automatique, automatique assistée ou purement humaine.
Se développe aussi la possibilité de rechercher sur le texte intégral du brevet traduit en anglais, ou encore de rechercher en chinois, ou bien en anglais, la requête étant alors traduite en chinois pour être lancée dans le texte en chinois, les résultats étant ensuite retraduits.

Ces dernières possibilités sont encore rarement disponibles, ou en phase bêta.

QUELQUES BASES SPECIALISEES          
             
Commençons par la base bibliographique ChinaPats dédiée aux brevets chinois, qui vient immédiatement à l’esprit.

Elle est en effet présente depuis longtemps sur Questel (CPAT) et Dialog (fichier n° 344). 

Elle a été alimentée par l’Office des brevets chinois depuis son ouverture, le 1er avril 1985, avec toutes les demandes déposées, jusqu’à l’arrêt de sa mise à jour (voir ci-dessous).
           
La plupart des demandes (88,5 %) ayant une priorité chinoise étaient traduites par l’office chinois, qui les envoyait à l’OEB à Vienne. Celui-ci produisait la base et ajoutait, le cas échéant, les numéros des autres brevets de la famille, issus de la base de données Inpadoc.
            
Lorsque la base DocDB, également réalisée par l’Office européen des brevets mais à La Haye, a pris en compte les brevets chinois, la production de ChinaPats a été arrêtée – arrêt des mises à jour en mars 2005 chez Questel et en janvier 2006 sur Dialog. On retrouve les informations de cette base, parfois enrichies, dans PlusPat/ FamPat sur Questel, construite à partir des données de DocDB.
             
Dans ces bases précisément, 98 % (pour les publications de 2005), 99,5 % (pour les publications de 2006) et 99,8 % (pour les publications de 2007) des demandes (A) avec priorité chinoise comportent un abstract.
            
Pour les documents publiés depuis janvier 2008 (mais l’arriéré est planifié), Questel propose une traduction automatique en anglais des titres et abstracts des demandes de brevets (A) et des modes d’utilité publiés (Y). Ces informations sont disponibles une semaine après publication.

On trouve également les demandes de modèles d’utilité (U) depuis 1985 et les modèles d’utilité délivrés (Y) depuis 1993. La base contient, enfin, les brevets délivrés (B et C)
           
Par ailleurs, Questel annoncera début mars un développement significatif de son offre de brevets chinois.
             
Sur STN, InpadocDB réalisée comme PlusPat à partir de DocDB, contient environ 1,6 million de brevets “purement” chinois, dont environ 500 000 avec un abstract – ce qui est de même ordre de grandeur que ce que l’on trouve sur Questel. Par contre, on n’y trouve aucune traduction des modèles d’utilité délivrés.
             
Toujours sur STN, Chemical Abstracts couvre les brevets chinois depuis l’origine (1985), mais seulement dans le domaine de la chimie au sens large. Les données bibliographiques et les résumés sont disponibles, dans un délai garanti maximum de 14 jours après la publication (le délai réel est, bien souvent, de 1 à 5 jours). Par ailleurs, l’indexation détaillée, en particulier des substances, est disponible en moins de 50 jours.
             
Les modèles d’utilités sont présents depuis 2006 et les brevets délivrés (C) sont disponibles depuis 2004. Les traductions sont des traductions humaines.
            
World Patents Index de Derwent, disponible sur les serveurs STN, Questel et Dialog, a fait récemment un effort pour la mise à disposition des brevets et modèles d’utilité chinois.
Les publications des demandes de brevets chinois n’ayant pas d’équivalent sont présentes dans WPI depuis le 10 septembre 1985 et les publications de brevets délivrés depuis le 1er janvier 1993.
            
L’ensemble représente plus de 1,34 million de documents.
             
En ce qui concerne les demandes, les résumés ne sont pas disponibles depuis le début et n’ont semblent-il été introduits que progressivement.
             
Le plus ancien que nous ayons trouvé avec un résumé Derwent a été publié en décembre 1993.
             
Comme nous le disions, Derwent a fait récemment un effort significatif sur les brevets chinois, puisque l’on trouve maintenant également les modèles (Y) publiés à partir du 3 octobre 2007.

Une traduction humaine du titre original, du résumé et de la première revendication est disponible, en plus de l’“alerting abstract” écrit par Derwent et de l’indexation manuelle.
            
Pour les documents (demandes de brevets ou de modèles d’utilité) publiés à partir du 9 juillet 2008, le résumé et toutes les revendications sont traduits manuellement et s’ajoutent aux informations créées habituellement par Derwent. Ces informations sont apparues pour la première fois avec la mise à jour 200852.
            
On notera le traitement particulier dont bénéficient les brevets chinois, eux seuls disposant d’une traduction humaine d’une partie des documents. On peut y voir bien sûr l’impact de la croissance particulièrement rapide de l’innovation chinoise.
            
 Plus prosaïquement, on peut aussi remarquer que les systèmes de traduction automatique du chinois vers l’anglais semblent être plus difficiles à mettre au point que, par exemple, du japonais vers l’anglais.
           
TotalPatent de LexisNexis, qui revendique en particulier la couverture la plus large des brevets déposés dans le monde, propose les demandes chinoises depuis le 10 septembre 1985, mais tous les résumés ne sont pas présents pour le moment. La source en effet est Inpadoc, et donc en fait DocDB de l’OEB.
             
Quelques tests ont fait apparaître que tous les modèles d’utilité n’étaient pas chargés. D’après le producteur, ceux de la période 1985 à 1992 sont présents et il est prévu de charger ceux postérieurs à 1992 au courant du deuxième trimestre 2009.
            
Une partie importante des fac-similés des brevets en chinois est déjà disponible en ligne sur ce serveur et cette part devrait croître encore.
             
Par ailleurs, le producteur annonce que d’ici six mois environ, les brevets chinois seront disponibles en texte intégral image et en traduction automatique.
             
NOUVEAUTE CHEZ PATBASE
             
PatBase, produite par MineSoft, a annoncé le 14 novembre qu’il était désormais possible de faire des recherches directement dans les langues ayant des caractères non latins, à savoir le chinois, le coréen, le japonais et le russe.
             
On entre dans ce cas la requête directement dans la langue originale et la recherche se fait sur le texte original. Tous les brevets de la famille apparaissent dans la réponse. Pour les brevets chinois, la recherche se fait dans le titre, le résumé et la première revendication.
            
Par ailleurs, PatBase propose les résumés en anglais des brevets chinois issus de DocDB, c’est-à-dire :

- les demandes de brevets et les brevets délivrés depuis 1985 ;

- les demandes de modèles d’utilité (U) depuis 1985 et les modèles d’utilité délivrés (Y) depuis 1993.
             
De plus, pour les brevets chinois n’ayant pas d’équivalent en anglais, le système propose une traduction machine des titres et des résumés en anglais. Ce principe est d’ailleurs valable pour toutes les langues.
             
DES DIFFERENCES IMPORTANTES D’UNE TRADUCTION A L’AUTRE
             
Nous nous sommes amusés à comparer les titres d’une demande de brevet et d’un modèle d’utilité chinois choisis au hasard, relativement récents mais pas trop, pour pouvoir comparer ce que l’on obtenait chez les différents fournisseurs.
            
La demande du brevet CN101153283 du 2 avril 2008 a pour titre “Method for producing recombined human interleukin-15” dans PlusPat, PatBase et TotalPatent.
Le mot recombined est remplacé par recombinant dans Chemical Abstracts.
             
Dans World Patents Index (WPI), la traduction du titre du brevet original est “Producing method for recombination of interleukin-15” et le titre enrichi par Derwent est “Constructing engineered cell highly expressing recombinant human interleukin-15 (IL-15) comprises tranforming host cell with an expression vector containing the optimized IL-15”.
             
Pour les résumés, PatBase et Questel proposent le même, manifestement issu de DocDB ; PlusPat offre en complément sa traduction machine. Quant à la traduction du brevet originel sur WPI, elle est assez différente dans sa formulation et l’on trouve aussi la traduction de la première revendication.
           
WPI ajoute par ailleurs le résumé enrichi et structuré (alerting abstract) qu’il a réalisé avec les rubriques Novelty, Use, Advantage et Technology Focus, en l’occurrence ici Biotechnology.
           
Pour le modèle d’utilité délivré (Y) : CN 201024114 du 20 février 2008, PlusPat et PatBase ont le même titre “Sewage treatment device of slaughtering factory for stock and fowl”, très différent de celui de Chemical Abstracts, “Apparatus for treating wastewater produced in butchery”.
              
Dans TotalPatent, on ne trouve ni titre, ni résumé en anglais.
             
Quant à WPI, le titre original traduit est encore différent : “Sewage treatment equipment in fixing livestock slaughter plant” ; le titre enrichi est “Sewage treatment equipment for livestock slaughtering plant has filter tank below which outlet is provided, and which has stuffing arranged within”. Quant aux résumés, ils sont tous significativement différents.
             
Comme on le voit, la recherche sur les traductions des brevets chinois est un exercice dans lequel la part de hasard est loin d’être négligeable et il faut faire preuve d’une grande créativité en terme de vocabulaire, pour limiter les risques de silence.
             
L’OFFRE CHINOISE
              
Tandis que tous les serveurs ayant une offre brevet élargissaient leur couverture à la Chine, l’Office chinois des brevets et d’autres organismes chinois enrichissaient égale-ment leur offre.
             
Nous nous limiterons ici aux bases disposant d’interfaces en anglais, sachant que ces dernières ont, en général, d’abord été mises à disposition avec des interfaces en chinois.
             
Le SIPO (State Intellectual Property Office of PRC) offre plusieurs interfaces réalisées par des directions différentes de cet organisme.

La plus connue est SIPO in English (www.sipo.gov.cn/ Sipo_English, puis cliquer sur Patent Search).
             
On peut rechercher dans les brevets et/ou les modèles d’utilité depuis 1985, année de création de l’Office chinois.
             
Les recherches sur les résumés ne sont possibles que sur les brevets. On peut combiner des requêtes dans différents champs. Une traduction automatique est disponible.
             
Fin janvier 2009, les données les plus récentes dataient d’octobre 2008, ce qui est un délai habituel pour cette base. Par ailleurs, elle connaît des problèmes de chargement, car nous n’y avons retrouvé ni le brevet ni le modèle d’utilité que nous avions pris en exemple plus haut.
            
Cela nous a été confirmé par les spécialistes de l’OEB à Vienne, qui ne les ont pas trouvés non plus et ont transmis cette information à leurs collègues chinois. Ces derniers ont reconnu qu’il s’agissait d’une erreur, qui sera bientôt corrigée.
           
On notera que le site du SIPO en anglais ne permet pas de retrouver les documents originaux, mais seulement des informations bibliographiques, des résumés (pour les brevets) et des traductions automatiques.
            
CNPAT du China Patent Information Center, une division du SIPO, offre des possibilités plus développées grâce, en particulier, à une interface de recherche avancée. Les possibilités d’édition sont elles aussi plus élaborées. Il est par exemple possible d’obtenir les documents originaux en format TIFF, à partir d’une recherche en anglais.
           
La base est accessible à l’adresse www.cnpat.com.cn, en cliquant ensuite sur Patent Search & Machine Translation.
             
Il ne faut pas oublier le .cn à la fin de l’adresse, car www.cnpat.com est l’adresse d’un cabinet de brevet.
             
C-Pat du CNIPR (China Intellectual Property Net ; http://english.cnipr.com/enpat/) a été lancée en avril 2008 et est hébergée par la Intellectual Property Publishing  House du ... SIPO.
Les possibilités de recherche sont légèrement différentes et l’on dispose dune interface de recherche avancée complexe, accessible en cliquant sur C-Pat Search, sur la gauche de la page d’accueil.
             
C’est la seule base à proposer des informations légales et on peut demander soit une traduction automatique, soit une traduction “humaine”. C’est aussi la seule base qui permet la traduction des résumés des modèles d’utilité en anglais, sur lesquels on peut effectuer des recherches.
            
Le SIPO propose enfin une “plate-forme expérimentale” à l’adresse http://pub.cnipr.com/enpubpisfts/index.do ; cette dernière contient des données pour la période 1985-2006, sans mise à jour.
             
Les possibilités de recherche sont proches de celles du premier site du SIPO, l’originalité étant la présence des informations légales en anglais.
             
Signalons par ailleurs que la société Paterra (www.paterra.com), spécialisée au départ sur les brevets japonais, offre aujourd’hui un système automatique de traduction de brevets chinois.
            
Il existe d’autres offres ou projets très discrets, mais le panorama que nous avons proposé est déjà riche de multiples possibilités, susceptibles d’évoluer rapidement dans le sens de l’amélioration.
             
Beaucoup de travaux sont en cours, tant pour l’amélioration des systèmes de traduction automatique que pour la recherche proprement dite.
             
On citera par exemple les travaux sur la recherche sémantique, la requête en anglais étant modélisée, puis effectuée en chinois à partir de ce modèle avec enfin, par le processus inverse, des résultats fournis en anglais.
            
EAST MEETS WEST
             
Pour ceux que le sujet passionne, on notera la réunion “East Meets West”, organisée chaque année depuis 2002 par le bureau de Vienne de l’Office européen des brevets, qui est un centre de compétence pointu sur le sujet et qui, d’ailleurs, propose un service de traduction des brevets chinois.
             
Le programme de l’édition 2008 avec les résumés et les coordonnées des intervenants est disponible sur le site de l’OEB à Vienne.
             
La prochaine édition est prévue les 23 et 24 avril 2009 à Vienne.

http://eastmeetswest.european-patent-office.org
             
LA FABRIQUE DE L’INFORMATION
             
Cet article fait le tour d’un sujet qui, pour être de plus en plus à la mode, est néanmoins complexe et fait intervenir une multitude d’acteurs.
             
Nous voudrions donc remercier ceux qui nous ont aidé d’une façon ou d’une autre : le Club francophone d’information brevet (CFIB) et, en particulier, Cécile Boyer-Joubert et Frédéric Baudour, qui ont présenté lors d’une réunion récente les résultats de leurs investigations sur les brevets d’origine asiatique, les différents serveurs/agrégateurs Capadoc – le représentant de STN –, Questel, TotalPatent, MineSoft et le service Asian Patent Information de l’Office européen des brevets à Vienne.


François Libmann
Publié dans le n° 256 de Bases (Janvier 2009)

Aucun commentaire:

Enregistrer un commentaire