Les "Meilleures stratégies" au MIS 2011

Les lecteurs de BASES savent combien nous attachons d’importance à la qualité des stratégies de recherche, en particulier sur les serveurs-agrégateurs.
            
Rappelons que ces serveurs-agrégateurs sont nés, pour les plus anciens, il y a plus de quarante ans ; ils ont certes évolué mais ils existent toujours, pour une bonne part d’entre eux, et leur existence n’a pas été remise en cause par les différentes révolutions informatiques, et notamment la déferlante d’Internet.

Ces serveurs-agrégateurs, qui ont chacun leurs spécificités, ont bien sûr adapté leurs interfaces à l’air du temps, mais ils ont toujours conservé leur grande puissance de recherche et ont, de plus, enrichi leur offre d’outils de traitement de l’information.
             
Les stratégies que nous présentons dans ce numéro illustrent la puissance mise à la disposition des utilisateurs, pour faire des recherches précises, dans un réservoir d’informations de plus en plus grand.
            
L’exploitation d’outils de traitement des données obtenues reste intéressante dans de nombreux cas, mais n’est pas une nécessité, contrairement à ce qui se passe avec de nombreux outils qui «moissonnent» large et qui doivent être couplés à des solutions de text mining et/ou d’analyse sémantique.
             
Parmi les stratégies présentées, seule celle sur STN utilise la combinaison d’étapes, qui rend la requête plus facile à construire puis à comprendre.
             
La stratégie présentée dans ce numéro illustre une nouvelle application, utilisable dans les brevets disponibles en ligne en texte intégral. Il s’agit de la possibilité de faire des recherches dans le texte du brevet, sur des tranches de différentes valeurs numériques, que l’on peut combiner entre elles et/ou avec des mots.
             
Si ce type de recherche n’a pas pour tous une utilité quotidienne, il enrichit la gamme des possibilités de recherche proposées par le serveur.
             
D’autres agrégateurs, tels que Factiva.com, Europresse.com et TotalPatent, n’offrent pas la possibilité de combiner les étapes.
             
Cela n’empêche pas, comme on le verra, l’utilisation de stratégies complexes ; elles sont simplement un peu plus délicates à construire (attention au «balancement» des parenthèses...).
             
On remarquera également que chaque agrégateur a son originalité.
             
Pour Factiva.com par exemple, c’est son indexation très développée ; on remerciera ici les concepteurs de la stratégie proposée pour le cadeau qu’ils font aux lecteurs de Bases, en leur offrant plusieurs champs sémantiques très complets, permettant notamment d’identifier des articles à tonalité positive ou négative.
             
Europresse.com pour sa part utilise dans sa stratégie sa terminaison +, qui lui permet de décliner verbes et noms.
             
Pour TotalPatent (banques de données sur les brevets, dont beaucoup sont en texte intégral), on appréciera dans la stratégie proposée l’usage qui est fait des équivalents unicode des lettres grecques.
             
On trouvera enfin dans ce numéro un exemple d’utilisation d’Intellixir, outil de traitement de l’information structurée, dont une partie est disponible en option sur Orbit.
             
Cet exemple assez percutant illustre l’efficacité que peut avoir une utilisation couplée d’Orbit et d’Intellixir pour trouver des pistes de diversification d’une technologie.
             
Comme on le voit, les utilisations de ces serveurs-agrégateurs sont multiples et ce n’est pas parce qu’ils sont parfois moins faciles à interroger que les moteurs de recherche disponibles sur Internet qu’il faut les négliger, loin s’en faut !
             
Ces stratégies seront présentées oralement lors d’une MasterClass, le 11 octobre à 9h45, à l’occasion du salon MIS à Paris, dont Bases est partenaire.
             
LA PREMIERE VALEUR EST DANS LA RECHERCHE
           
Il est de bon ton de valoriser analystes et autres consultants effectuant la noble tâche de traiter l’information mise à leur disposition d’une façon ou d’une autre, qu’ils aient eux-même effectué des recherches rapides sur Google par exemple ou qu’ils aient sous-traité la requête à un stagiaire.
             
Sans nier, bien entendu, la valeur ajoutée qui existe dans le traitement de l’information, il ne faut pas oublier que cette valeur ajoutée est fortement dépendante de la qualité des informations à partir desquelles le traitement est effectué.
             
Le fait est qu’on oublie beaucoup trop souvent que la première valeur ajoutée est dans la recherche.
             
Or, si des moteurs de recherche comme Google représentent indéniablement un moyen simple d’accéder à de multiples sources d’information gratuites, il n’en demeure pas moins que parallèlement à ces sources, les grands serveurs donnent la possibilité d’interroger de façon extrêmement sophistiquée de multiples gisements d’informations professionnelles et qualifiées.
             
C’est l’objet de ce numéro spécial que de montrer un échantillonnage de ce que les professionnels de l’information peuvent réaliser sur les grands serveurs ... mais ni sur Google ni sur des bases brevet gratuites!



François Libmann

Publié dans le n° 285 de Bases (Septembre 2011)

Aucun commentaire:

Enregistrer un commentaire