Thomson Innovation : un produit qui vient de louin


Les premières réflexions qui ont finalement conduit à la création du produit Thomson Innovation remontent à la période 2004-2006, au cours de laquelle des études de marché et des rencontres avec plus de 1 500 clients conduirent à l’idée d’un nouveau produit/service. Ce dernier fut testé en 2006-2007 auprès de plus de 600 clients potentiels.
             
Une première mouture fut finalement présentée au Online à Londres, en décembre 2007.
             
On en est aujourd’hui à la septième version, lancée en juillet 2009.

             
Si nous avions annoncé le lancement de ce produit en son temps, il ne nous a pas été possible – pas plus qu’à d’autres journalistes – de le tester immédiatement, car il restait encore quelques bugs.
             
Par ailleurs, à mesure du développement des nouvelles versions, le produit s’est enrichi à la fois en contenu et en fonctionnalités – d’analyse en particulier –, ce qui le rend plus intéressant.
            
On notera que le développement de ce produit a résisté, au moins jusqu’à aujourd’hui, au rachat de Reuters par Thomson – bouclé en avril 2008, mais initié un an auparavant –, alors que Thomson Reuters s’est délesté rapidement de Dialog et DataStar, vendus à Proquest.
             
Il est vrai que Thomson Scientific avait accumulé, depuis plus ou moins longtemps, toute une série de briques de tailles significatives et de qualité, liées aux brevets et à l’information scientifique et technique. On citera la banque de données Derwent World Patents Index et Web of Science, ainsi que Delphion, racheté en 2002 à IBM et IHI (Information Holding Inc), racheté en 2004. IHI possédait MicroPatent, lequel avait racheté Aurigin – alors en dépôt de bilan – et son produit d’analyse Aureka. Ironie de l’histoire, Thomson avait déjà voulu acheter Aurigin, mais c’est MicroPatent qui l’avait emporté.
             
Cela procédait d’une vision stratégique, comme l’expliquait en 2004 Vin Caraher, président et CEO de Thomson Scientific, à la revue Research Information : “Thomson achète des activités qui lui permettent de construire des solutions intégrées d’informations pour les professionnels. Pour résumer, nous souhaitons construire un outil de workflow de qualité, pour aider nos clients à prendre de meilleures décisions et à les prendre plus vite. Nous acquerrons du contenu et de la technologie avec les applications pour que cela fonctionne bien”.
             
Tout ceci a conduit au développement et à la mise au point d’un produit très intégré, avec de multiples fonctionnalités de recherche, de visualisation et de traitement orientées vers la R&D. L’objectif de ce produit est d’améliorer l’efficacité de la démarche de R&D avec un contenu brevet et littérature scientifique conséquent et un complément d’informations d’orientation plus business.
             
On comprend alors que Dialog surtout, et DataStar dans une moindre mesure, aient pu être considérés comme des produits relativement concurrents en terme de contenu, avec moins de fonctionnalités intégrées mais avec des langages d’interrogation plus souples et plus puissants. Le choix de s’en séparer devenait logique et s’est fait sans tarder.
             
UN CONTENU A LA CARTE
            
Aujourd’hui donc, Thomson Innovation offre en terme de contenu :
           
- une large collection de brevets avec Derwent World Patents Index, les brevets PCT, US, européens, anglais, français et allemands avec des dates d’antériorité variables, qui peuvent être importantes (1836 pour les brevets US délivrés, 1963 pour les brevets japonais délivrés). On trouve aussi une très riche collection de brevets et modèles d’utilité chinois, japonais et coréens, dont une partie traduite en entier en anglais, par exemple depuis 2003 pour les demandes japonaises publiées.
             
Ces brevets de la zone Asie-Pacifique sont évidemment là pour répondre à la demande croissante des clients sur cette zone et sont un argument marketing ;
            
- une collection très significative également en matière de littérature scientifique avec Web of Science, Current Contents Connect, Conference Proceedings et la banque de données Inspec ;
            
- des données plus orientées business, conçues comme un complément. On trouve par exemple Gale Group Company Intelligence pour les informations sur les entreprises, TableBase pour les séries numériques sur toutes sortes de thématiques économiques, la banque de données NewsRoom de Dialog ou encore la base New Product Announcements, qui reprend des communiqués de presse et un annuaire d’organismes de recherche.
            
Il faut préciser que tous les utilisateurs n’ont pas accès à la totalité du contenu. En effet, les contrats définissent un contenu “à la carte”, la partie Derwent World Patents Index en représentant une part importante et… coûteuse.
             
DE MULTIPLES PREFERENCES
            
On notera que la partie Préférences est particulièrement complexe et développée sur Thomson Innovation.
             
C’est un parti pris manifeste pour la recherche puisque, grâce à cela, une fois les préférences établies – elles sont bien entendu modifiables –, l’utilisateur se préoccupe uniquement de sa recherche et très peu de l’écriture des commandes.
             
Ce parti pris est également lié aux nombreuses possibilités de traitement qui sont intégrées au produit. De plus, Delphion et MicroPatent ayant, dans le passé, fait des choix différents – par exemple pour le format de visualisation du dictionnaire des auteurs –, Thomson a souhaité que chacun puisse garder ses habitudes grâce à un simple paramétrage.
            
A la connexion, le système propose de garder, si on le souhaite, les recherches de la précédente session, mais cela peut être modifié dans les préférences.
             
Pour l’administrateur, une partie importante est consacrée aux outils dont il dispose pour gérer les droits des utilisateurs et le partage des informations. Nous ne rentrerons pas dans les détails ici.
             
On trouve en haut de l’écran un module de Quick Search qui peut chercher sur tout le contenu, seulement dans la partie brevets ou dans la littérature scientifique, ou encore dans la partie business. Cette recherche rapide donne une première idée des résultats d’une stratégie, car les différents documents n’ont pas exactement les mêmes structures.
            
Laissant de côté l’option Quick Search, l’option Search propose de rechercher sur l’une des trois grandes catégories de contenu, ou sur les trois à la fois (Cross Search) mais avec, dans ce cas, des options plus limitées en terme de choix de champs, qui doivent être communs à tous les types de documents.
             
Si l'on choisit la recherche brevets, trois possibilités sont offertes :
            
- une recherche par numéro de brevet ;
             
- une recherche par champ, dans laquelle on définit une série de couples champs /terme de recherche, que l’on peut combiner entre eux. Il faut prendre garde au fait que, si l’on inclut WPI dans la recherche, certains champs de cette base ne se retrouveront pas dans les autres collections de brevets ;
            
- une recherche experte, qui consiste à écrire une équation de recherche en précisant pour chaque terme dans quel(s) champ(s) il doit se trouver.
             
De nombreuses aides sont disponibles, tant sur le détail des collections de brevets que sur les classifications proposées (IPC, ECLA, classifications américaines et japonaises).
             
A partir de la visualisation d’un brevet on peut, d’un simple clic, relancer une recherche sur le nom du déposant, d’un inventeur, sur la famille de brevets ayant la même priorité ou sur l’un des codes d’une classification.
             
On peut visualiser aussi le statut légal, les familles WPI et Inpadoc.
             
Pour la littérature (scientifique), quatre collections sont proposées, dont deux appartiennent à Thomson, en l’occurrence Web of Science et Conference Proceedings. On dispose également de Current Contents Connect et de la banque de données Inspec.
La encore trois possibilités de recherche sont offertes, mais elles sont différentes de celles proposées pour les brevets :
             
- par champ ;
            
- par références citées, mais uniquement dans le Web of Science et les Conference Proceedings ;
             
- en mode expert.
            
Comme pour les brevets, on peut relancer la recherche sur certains éléments, comme l’auteur ou la publication. On trouve aussi souvent un lien vers le site de l’éditeur et le mail d’un des auteurs. On peut également, le cas échéant, visualiser les références citées et citantes.
            
La Business Search n’est possible que par champs, mais on a le choix des sources : company, market, products, news et research.
            
La Cross Search, qui cherche sur l’ensemble du contenu, n’est également disponible que par champs.
           
La Search History enfin permet  de relancer une recherche déjà effectuée, mais aussi de combiner par AND, OR ou NOT, les questions précédemment traitées.
             
Dès l’écran de résultats – dont le format peut être paramétré et dans lequel les termes de recherche apparaissent de différentes couleurs – l’utilisateur se voit proposer de multiples options de sauvegarde, de mise en place d’alerte, de récupération et d’export de documents sous diverses formes, et également d’analyse.
            
Lorsqu’un document est visualisé, on peut en avoir une traduction immédiate dans plusieurs langues grâce à Systran.
             
Lorsqu’il s’agit de brevets, on peut aussi obtenir un graphique avec les brevets cités/citants ; l’équivalent est disponible pour la littérature.
             
DE NOMBREUSES POSSIBILITES D’ANALYSE
            
La mise à disposition d’outils d’analyse d’ensembles de résultats de brevets ou de littérature scientifique est de plus en plus fréquente chez les serveurs.
             
On pense en particulier à Questel et STN ; Thomson Innovation s’inscrit dans cette lignée, en utilisant notamment les possibilités d’Aureka, acquis il y a quelques années. Cette possibilité n’est pas offerte pour les informations business.
             
Dans l’onglet Analyse, le premier choix est Charts. On peut alors utiliser les modèles proposés.
             
Ainsi, Top Assignees donne immédiatement un histogramme avec les plus importants déposants de l’ensemble des brevets sélectionnés, et fait de même avec les inventeurs ou les codes de la classification des brevets.
             
On peut aussi construire un histogramme sur mesure.
Plus spectaculaire, bien que déjà vu, on peut faire apparaître une carte avec vallées et montagnes, illustrant les concentrations de brevets dans lesquels apparaissent les même termes, qu’on peut d’ailleurs lire sur la carte.
             
Des manipulations de ces cartes permettent de multiples applications, telles que de découvrir la spécialité ou les technologies utilisées par tel ou tel déposant et en déduire des opportunités de collaboration ou de créneaux technologiques libres.
             
La troisième option est le Text Clustering qui, à partir de 10 documents sélectionnés jusqu’à 10 000 brevets ou 1 000 articles, analyse les champs que l’on a préalablement choisis et permet de voir quels sont les termes les plus souvent utilisés et de visualiser les brevets correspondant aux termes sélectionnés.
             
Comme on le voit, Thomson Innovation est un produit à la fois simple et complexe, avec de multiples possibilités qu’il faut apprendre à maîtriser.



François Libmann

Publié dans le n° 263 de Bases (Septembre 2009)

Aucun commentaire:

Enregistrer un commentaire