Les lecteurs de BASES savent combien nous attachons d’importance à la
qualité des stratégies de recherche, en particulier sur les
serveurs-agrégateurs.
Rappelons que ces
serveurs-agrégateurs sont nés, pour les plus anciens, il y a plus de quarante
ans ; ils ont certes évolué mais ils existent toujours, pour une bonne part
d’entre eux, et leur existence n’a pas été remise en cause par les différentes
révolutions informatiques, et notamment la déferlante d’Internet.
Ces serveurs-agrégateurs,
qui ont chacun leurs spécificités, ont bien sûr adapté leurs interfaces à l’air
du temps, mais ils ont toujours conservé leur grande puissance de recherche et
ont, de plus, enrichi leur offre d’outils de traitement de l’information.
Les stratégies que nous
présentons dans ce numéro illustrent la puissance mise à la disposition des
utilisateurs, pour faire des recherches précises, dans un réservoir
d’informations de plus en plus grand.
L’exploitation d’outils de
traitement des données obtenues reste intéressante dans de nombreux cas, mais
n’est pas une nécessité, contrairement à ce qui se passe avec de nombreux
outils qui «moissonnent» large et qui doivent être couplés à des solutions de
text mining et/ou d’analyse sémantique.
Parmi les stratégies
présentées, seule celle sur STN utilise la combinaison d’étapes, qui rend la
requête plus facile à construire puis à comprendre.
La stratégie présentée
dans ce numéro illustre une nouvelle application, utilisable dans les brevets
disponibles en ligne en texte intégral. Il s’agit de la possibilité de faire
des recherches dans le texte du brevet, sur des tranches de différentes valeurs
numériques, que l’on peut combiner entre elles et/ou avec des mots.
Si ce type de recherche
n’a pas pour tous une utilité quotidienne, il enrichit la gamme des
possibilités de recherche proposées par le serveur.
D’autres agrégateurs, tels
que Factiva.com, Europresse.com et TotalPatent, n’offrent pas la possibilité de
combiner les étapes.
Cela n’empêche pas, comme
on le verra, l’utilisation de stratégies complexes ; elles sont simplement un
peu plus délicates à construire (attention au «balancement» des parenthèses...).
On remarquera également
que chaque agrégateur a son originalité.
Pour Factiva.com par
exemple, c’est son indexation très développée ; on remerciera ici les
concepteurs de la stratégie proposée pour le cadeau qu’ils font aux lecteurs de
Bases, en leur offrant plusieurs champs sémantiques très complets, permettant
notamment d’identifier des articles à tonalité positive ou négative.
Europresse.com pour sa
part utilise dans sa stratégie sa terminaison +, qui lui permet de décliner
verbes et noms.
Pour TotalPatent (banques
de données sur les brevets, dont beaucoup sont en texte intégral), on
appréciera dans la stratégie proposée l’usage qui est fait des équivalents
unicode des lettres grecques.
On trouvera enfin dans ce
numéro un exemple d’utilisation d’Intellixir, outil de traitement de
l’information structurée, dont une partie est disponible en option sur Orbit.
Cet exemple assez
percutant illustre l’efficacité que peut avoir une utilisation couplée d’Orbit
et d’Intellixir pour trouver des pistes de diversification d’une technologie.
Comme on le voit, les
utilisations de ces serveurs-agrégateurs sont multiples et ce n’est pas parce
qu’ils sont parfois moins faciles à interroger que les moteurs de recherche
disponibles sur Internet qu’il faut les négliger, loin s’en faut !
Ces stratégies seront
présentées oralement lors d’une MasterClass, le 11 octobre à 9h45, à l’occasion
du salon MIS à Paris, dont Bases est partenaire.
LA PREMIERE VALEUR EST
DANS LA RECHERCHE
Il est de bon ton de
valoriser analystes et autres consultants effectuant la noble tâche de traiter
l’information mise à leur disposition d’une façon ou d’une autre, qu’ils aient
eux-même effectué des recherches rapides sur Google par exemple ou qu’ils aient
sous-traité la requête à un stagiaire.
Sans nier, bien entendu,
la valeur ajoutée qui existe dans le traitement de l’information, il ne faut
pas oublier que cette valeur ajoutée est fortement dépendante de la qualité des
informations à partir desquelles le traitement est effectué.
Le fait est qu’on oublie
beaucoup trop souvent que la première valeur ajoutée est dans la recherche.
Or, si des moteurs de
recherche comme Google représentent indéniablement un moyen simple d’accéder à
de multiples sources d’information gratuites, il n’en demeure pas moins que
parallèlement à ces sources, les grands serveurs donnent la possibilité
d’interroger de façon extrêmement sophistiquée de multiples gisements
d’informations professionnelles et qualifiées.
C’est l’objet de ce numéro
spécial que de montrer un échantillonnage de ce que les professionnels de
l’information peuvent réaliser sur les grands serveurs ... mais ni sur Google
ni sur des bases brevet gratuites!
François Libmann
Publié dans le n° 285 de Bases (Septembre 2011)
Aucun commentaire:
Enregistrer un commentaire