Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Dès 2006, nous avions évoqué cette question notamment dans un article consacré au marché chinois de l’information à partir d’une conférence donnée au Salon Online de Londres (demander le BASES n°233 - décembre 2006 à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).
Depuis, les initiatives chinoises se sont multipliées et l’offre et l’accessibilité se sont élargies de plusieurs façons :
Lire aussi :
Retour de l’indexation de la littérature chinoise dans Chemical Abstracts
DBpia une base de données académique coréenne
Brevets et littérature scientifique: l'irrésistible développement de la Chine
L’intégration de l’IA dans les outils de recherche est le grand sujet de ce début d’année 2023. Et cela s’applique également au monde des moteurs de recherche académique.
Il y a quelques mois, nous présentions Elicit, un moteur innovant qui se présente comme un assistant dopé à l’IA
Voir notre article « Elicit, un nouveau moteur scientifique au banc d’essais » - BASES n°404 - juin 2022
Dans la même veine, nous nous intéressons maintenant à un nouvel outil : Consensus dont nous allons analyser les capacités, les forces, les faiblesses et la valeur ajoutée pour le professionnel de l’information.
Depuis leur apparition il y a un peu moins de 400 ans, les revues scientifiques ont été confrontées à de nombreuses évolutions : le passage du papier au numérique, l’apparition des preprints, le développement de l’open access et plus largement de l’open science, etc.
Mais s’il y a bien quelque chose qui n’a que très peu changé, c'est la structure même de l’article scientifique. Malgré une transformation digitale, la version numérique de l’article, souvent en PDF, est presque toujours semblable à ce qui existait déjà au format papier.
Certains acteurs commencent à modifier la structure même de l’article scientifique ou tout du moins à proposer un modèle de diffusion qui ne soit plus limité à ce format très codifié et où les différentes parties d’un article peuvent vivre indépendamment les unes des autres.
Dialog Solutions vient d’ajouter trois stratégies prêtes à l’emploi (Hedges) aux sept qu’il proposait déjà dans le domaine biomédical.
La mise à disposition de requêtes préétablies existe depuis un moment déjà tant pour des serveurs/agrégateurs que pour des banques de données, mais font rarement l’objet de l’attention du public des pros de l’info.
Elles peuvent pourtant être appliquées telles quelles ou servir de base à la constitution de nouvelles stratégies de recherche.
L’opus 2022 de l’Artificial Intelligence Conference on Search, Data and Text Mining, Analytics and Visualization plus connue sous le vocable « AI-SDV » vient de se terminer dans une atmosphère particulière.
Si les contributions ont été, pour la plupart, de qualité et le réseautage efficace, nous retiendrons que c’est une manifestation de plus que les professionnels de l’information ne connaîtront probablement plus, la faute du Covid qui a « tué » la manifestation à petit feu.
Les plus anciens se souviennent d’un temps où les événements se bousculaient parfois à l’agenda, autant que le public à ces événements. Ces derniers risquent maintenant de se limiter aux dates proposées par l’EPO (European Patent Office) ou les groupes d’utilisateurs. Dans cet article, Benoit Sollie et François Libmann soulignent quelques présentations (disponibles sur Internet) et lignes de force qui ont marqué cette dernière édition.
Eutopia est l’une des 44 alliances labellisées « Université Européenne » par la Commission européenne et vient de lancer un portail avec les publications de ses membres. Elle regroupe dix universités (pour un total de 100 facultés), dont celle de Cergy, en France.
Le portail commun à l’alliance (https://eutopia.openaire.eu/) suit deux objectifs majeurs :
1. Faciliter la visibilité des productions scientifiques et des chercheurs de l’alliance ;
2. Fluidifier le travail au sein de l’alliance.
Ce portail recueille, à l’heure où nous imprimons, plus de 570 000 publications (dont plus de 368 000 ouvertes) et 21 000 datasets de recherche. L’alliance est généraliste et le portail couvre donc de nombreux domaines, des mathématiques aux sciences naturelles en passant par la médecine ou l’informatique.
Lire aussi :
Le Canada explore un portail pour accéder aux résultats de la recherche canadienne
Elsevier vient d’annoncer le lancement de la base de données Embase Preprints.Cette base propose des documents de travail et preprints issus des deux principaux sites de preprints dans le domaine biomédical à savoir MedRXiv et, depuis décembre 2021, BioRXiv.
Un algorithme d’indexation automatique permet d’affecter à chaque document l’essentiel de l’indexation du thesaurus EMTREE propre à Embase.
La mise à jour se fait tous les jours de la semaine.
Elsevier tient à garder la différence de nature entre les contenus d’Embase et ceux d’Embase Preprints. En effet, les alertes d’Embase n’incluront pas automatiquement les mises à jour d’Embase Preprints ; il reste la possibilité, bien sûr, d’enregistrer une alerte dans chaque base.Mise à part la création de cette base, il faut signaler qu’un nombre croissant de bases offrent des références de preprints.
Nous avons fait un test pour voir si les preprints de Medrxiv étaient bien référencés dans Embase Preprints.
Les 400 clients de FIZ Autodoc ont reçu un mail leur annonçant la fermeture du service à la fin de l’année.
Ce service est, ou était, l’un des rares services européens de fourniture de documents primaires après la disparition du service de l’INIST aux entreprises. FIZ Autodoc (https://autodoc.fiz-karlsruhe.de/) sous-traitait d’ailleurs une partie de ses prestations à des « confrères » comme la British Library ou l’américain Reprints Desk…
Auparavant, déjà, la possibilité de voir les prestations de FIZ Autodoc imputées sur la facture STN, ce qui était bien pratique, avait disparu au début de l’année.
Cet arrêt du service tient très vraisemblablement au désengagement de FIZ dans STN, les bases présentes sur FIZ ayant vocation à basculer sur les serveurs de l’American Chemical Society, qui reste le seul opérateur de ce serveur, à l’origine une association entre l’allemand FIZ Karlsruhe et l’American Chemical Society, rejoints pendant quelques années par le japonais JICST.
Cela fait des années que le mouvement de l’open dans le monde scientifique et académique ne cesse de prendre de l’ampleur : l’open access d’abord puis l’open citations, mais aussi l’ouverture des données de la recherche,
Pour rappel, les données de la recherche correspondent à « l’ensemble des informations collectées, observées ou créées sous une forme numérique ou non, par les chercheurs dans le cadre d’un projet de recherche et à partir desquelles ils bâtissent leurs hypothèses. » (source : https://bu.univ-amu.libguides.com/donneesrecherche/definition-DR).
Il n’existait pas jusqu’ici d’initiative nationale pour la diffusion et la recherche des données de la recherche française (alors qu’il existe depuis des années un portail national pour les données publiques issues des collectivités et de l’État appelé data.gouv.fr). C’est désormais chose faite avec le lancement le 8 juillet dernier de la plateforme Recherche Data Gouv (https://entrepot.recherche.data.gouv.fr/).
Pendant longtemps, on a considéré que pour faire une recherche raisonnablement exhaustive de références bibliographiques scientifiques, il fallait, pour peu que l’on en ait les moyens, utiliser les serveurs ou agrégateurs payants tels que STN, Dialog, Scopus, ou encore Web of Science.
Mais à côté de ces puissants outils traditionnels, se sont développés de nombreux sites web gratuits, proposant, avec différentes interfaces user-friendly des références bibliographiques, de littérature scientifique et de brevets.
La question que se posent maintenant de nombreux de professionnels de l’information est de savoir s’il est raisonnable de limiter ses recherches aux grands serveurs/agrégateurs ou s’il est devenu utile, voire indispensable, de compléter ses recherches par l’interrogation de nombreux sites web en accès gratuit, dont on ne peut ignorer qu’ils ont aujourd’hui des contenus significatifs.
Lire aussi :
Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ?
Elicit, un nouveau moteur scientifique au banc d’essai
The Lens pour la littérature scientifique : des contenus mal valorisés
Canada Explore est un portail permettant d’accéder aux résultats de la recherche canadienne (cf. figure 1. Interface de Canada Explore).
Il a été développé grâce à une collaboration entre la Canadian Association of Research Libraries (CARL) et OpenAIRE, ce qui permet aux résultats disponibles sur le portail canadien d’être aussi disponibles sur OpenAIRE.
OpenAIRE, dont nous avons déjà parlé à plusieurs reprises, est un portail créé à l’initiative de la Commission Européenne pour retrouver les références des résultats des recherches financées par la Commission, avec un principe de libre accès.
Lire aussi
La veille au défi de l’information scientifique et technique
Comment bien rechercher l’information scientifique et technique ?
SAE International est une association existant depuis plus d’un siècle qui regroupe plus de 200 000 experts dans le monde de la mobilité et des transports.
SAE International vient de lancer un serveur de préprints en accès libre baptisé SAE MobilityRxiv (https://mobilityrxiv.sae.org) qui se présente comme le premier serveur de cette nature dans le domaine des transports et des mobilités (Cf. Figure 1. Interface de SAE MobilityRxiv).
Figure 1. Interface de SAE MobilityRxiv
Ce serveur, qui donne accès à des articles, livres blancs et thèses en langue anglaise n’ayant pas encore fait l’objet d’une revue par les pairs, est destiné à faciliter le dialogue entre experts pour faciliter l’avancement du savoir dans les domaines des transports et de la mobilité.
Lancé récemment, ce site ne propose que quelques dizaines de documents, ce nombre devant vraisemblablement croître rapidement.
En tout cas, c’est une nouvelle source dans le domaine.
Lire aussi :
Les portails documentaires en libre accès : de l’or brut pour le veilleur
Zoom sur Cerema Doc, la plateforme documentaire du climat et territoires de demain
Comment bien rechercher l’information scientifique et technique ?
La veille au défi de l’information scientifique et technique
Il y a quelques mois, l’INRS (Institut National de Recherche et de Sécurité) a mis en ligne son nouveau portail documentaire à l’adresse https://portaildocumentaire.inrs.fr/. On y trouve de multiples ressources en santé et sécurité au travail.
On y trouve tout d’abord INRS Biblio, une base de données bibliographique consacrée à la santé et sécurité au travail avec un focus plus spécifique sur la prévention.
À cela s’ajoutent les produits documentaires réalisés par les veilleurs et documentalistes de l’INRS :
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
Chaque année la National Library of Medecine (NLM) fait évoluer son célèbre thesaurus MeSH (Medical Subject Headings) avec ajout, suppression ou modification des termes.
La version 2017 est maintenant disponible et la banque de données accessible sur plusieurs serveurs va être entièrement rechargée avec cette version. Le rechargement sur Dialog Proquest est annoncé pour le 15 janvier prochain (bases de données MEDLINE et ToxLine).
Auteur : François Libmann, Directeur de publication
On peut réaliser une veille ou une recherche bibliographique via des bases de données bibliographiques spécialisées présentes sur les serveurs et agrégateurs, via les sites des éditeurs scientifiques ou encore tout simplement sur le Web ouvert et gratuit (via Google Scholar par exemple). On identifie alors une liste de notices bibliographiques comprenant généralement le titre de l’article, le nom des auteurs ainsi que le résumé et parfois quelques termes d’indexation.
Dialog a chargé récemment la banque de données bien connue clinicaltrials.com qui est, par ailleurs, accessible gratuitement à cette même adresse.
Cette banque de données présente près de 400 000 essais cliniques réalisés ou en cours de réalisation aux États-Unis et dans 200 pays du monde entier.
Il faut savoir que tous les essais cliniques réalisés ne sont pas présents, car leur enregistrement n’est pas toujours obligatoire.
Chaque document est extrêmement détaillé avec de multiples champs.
Lire aussi :
Dialog devient une source pour l’open access avec la base Publicly Available Content
Dialog : Embase French Literature devient accessible à tous
Dialog s’est enfin décidé à évoluer
Comment bien rechercher l’information scientifique et technique ?
Dans l’article précédent « The Lens, un outsider au fort potentiel pour la recherche brevet gratuite », Philippe Borne s’est focalisé de façon détaillée sur la partie brevet de The Lens.
Dans cet article nous examinerons la partie consacrée à la littérature scientifique de The Lens que l’on atteint en cliquant sur « Scholary works » dans le menu déroulant « Our apps » sur la page d’accueil.
La recherche dans la littérature scientifique sous forme numérique est disponible depuis très longtemps à de multiples endroits de façon gratuite ou payante. Ici, elle est limitée aux documents dont les références sont en accès libre, ce qui ne préjuge pas de la gratuité ou non de l’accès au document lui-même (41 millions sont en accès libre).
Ces références proviennent de Crossref, Pubmed, Core et Microsoft Academic, sachant que Microsoft vient d’annoncer l’arrêt de son service Microsoft Academic, ce qui risque de poser problème.
Les fusions/acquisitions sont depuis longtemps très fréquentes dans le domaine de l’information.
Près de nous, voici des années que Questel rachète des sociétés, en France comme à l’étranger, offrant divers services liés à la propriété intellectuelle, cœur de son activité. Dans un autre domaine, Cision a acheté il y a quelques années Europresse, l’Argus de la Presse et PR Newswire. Cette situation existe aussi aux Etats-Unis.
Aujourd’hui, il s’agit d’un achat important d’un acteur essentiellement privé, en l’occurrence Proquest par l’acteur public qu’est Clarivate. La transaction s’élève à 5,3 milliards de dollars, dont quatre en liquide et 1,3 en actions.
Le nombre de publications scientifiques ne cesse de croître de façon soutenue. La technologie a permis de les rendre accessibles auprès de nombreuses plateformes soit sous forme de références bibliographiques soit en texte intégral.
On note que certaines de ces plateformes offrent des dizaines voire des centaines de millions de documents.
Cette croissance du nombre de publications est due également à la forte augmentation du nombre de chercheurs et auteurs, elle-même liée à l’amélioration du niveau global d’éducation.
- ne pas le confondre avec un autre auteur ayant nom/prénom(s)/initiale(s) de prénom(s) identiques ou très semblables ;
- être capable de se rendre compte que deux auteurs aux identifications ayant des points communs proches peuvent être en fait un seul et même auteur.
Il est d’abord loin d’être évident d’identifier toutes les publications d’un auteur, sauf si celui-ci a souhaité en donner une liste exhaustive, sur son site web, sur son profil Google Scholar ou dans ORCID.
Voir aussi :
Du Dark Web au Clear Web : Aleph Networks, une nouveauté pour la veille ?
Plateformes de veille : qu’ont-elles à offrir aux PME et TPE ?
La banque de données Inspec spécialisée dans les domaines de l’ingénierie, la physique et l’informatique est un des classiques historiques des grandes banques de données bibliographiques avec abstracts recensant la littérature de leur domaine.
Dans cet article, nous revenons sur la place et l’intérêt d’Inspec dans un contexte de recherche et de veille scientifique et technique. Dans un second temps, nous analysons les différences entre la base Inspec et un de ses concurrents, l’IEEE Xplore digital library.
L’information scientifique et technique a toujours eu une place à part dans le processus de veille et de recherche d’information.
On considère souvent que l’IST ne concerne que les entreprises et organisations en lien avec la recherche et développement ou l’enseignement supérieur et qu’elle est plus difficile à appréhender que d’autres types d’information. Au sein d’une même organisation, il n’était pas rare de trouver par le passé des services d’information dédiés à l’information scientifique d’un côté et d’autres services pour la recherche d’information business et la veille stratégique et concurrentielle de l’autre.
Lire aussi :
Comment bien rechercher l’information scientifique et technique ?
Les brevets et les marques, des outils d'information particuliers et puissants au service de la démarche de recherche et de veille
De la référence bibliographique au texte intégral des articles scientifiques, il n’y a pas toujours qu’un pas
Rechercher l’information scientifique et technique (qui inclut aussi bien les sciences dites « dures » que les sciences humaines et sociales ») ressemble peu à la recherche dans les domaines business, actualités ou encore juridique.
Le processus de publication scientifique a ses propres codes et spécificités. Et contrairement à d’autres domaines où les moteurs web généralistes comme Google sont souvent d’une aide précieuse pour la recherche, ils sont ici peu efficaces pour arriver au résultat escompté.
La recherche d’information scientifique et technique nécessite de savoir utiliser une combinaison de sources, d’outils spécifiques et des méthodes adaptées.
Lire aussi :
Les nouveaux outils de recommandation pour l’IST
Tour du monde des sites de thèses en accès libre - Dossier spécial
La veille au défi de l’information scientifique et technique
Les brevets et les marques, des outils d'information particuliers et puissants au service de la démarche de recherche et de veille
De la référence bibliographique au texte intégral des articles scientifiques, il n’y a pas toujours qu’un pas
Les résumés automatiques nouvelle génération au service de la veille
Identifier des références d’articles scientifiques et académiques est une chose, accéder aux documents en texte intégral en est une autre.
En effet, de nombreux outils de recherche pour l’information scientifique et technique ne donnent accès qu’aux références bibliographiques de documents (titre, métadonnées, abstract, etc.) mais pas nécessairement au texte intégral.
Si dans certains cas, identifier le texte intégral est un véritable jeu d’enfant, dans d’autres, cela relève du parcours du combattant surtout si on cherche à l’obtenir gratuitement.
Lire aussi :
Rechercher des articles scientifiques anciens : entre intuition et méthodologie
La veille au défi de l’information scientifique et technique
Comment bien rechercher l’information scientifique et technique ?
Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).
Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.
On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.
Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.
Lancée le 18 décembre 2019, le « new PubMed » (voir figure 1.) est devenu le 18 mai dernier la plateforme par défaut de PubMed, la précédente (legacy PubMed) restant en ligne au moins jusqu’au 30 octobre 2020.
Cette période de cinq mois a été mise à profit pour réaliser différents tests et recueillir les réactions des premiers utilisateurs.
L’outil gratuit Pubmed a été lancé en 1996 comme un site Web expérimental et revendique aujourd’hui 3,4 millions d’utilisateurs pour un jour de semaine moyen, effectuant des recherches dans un corpus de plus de 31 millions de références bibliographiques.
Lire aussi :
Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTOP
Après plusieurs mois pendant lesquels le coronavirus occupait la majorité des actualités de la veille et de la recherche d’information avec de nouvelles ressources et de nouveaux outils dédiés, on sent bien que la vie professionnelle reprend progressivement son cours avec le lancement de nouveaux outils et de nouvelles fonctionnalités et l’aboutissement de projets en cours.
Il y a quelques mois, nous avions eu l’occasion de parler d’un nouvel outil 2D Search qui permet de créer ses requêtes sur des moteurs et bases de données en 2 dimensions. L’idée étant que les requêtes peuvent être parfois longues et complexes et sont propices aux erreurs. En créant sa requête sous forme de blocs combinables, la requête est plus lisible et plus facilement modifiable. À l’époque, l’outil intégrait déjà Google, Google Scholar (même si nous ne recommandions pas son utilisation sur la suite Google), Bing, Pubmed et quelques autres.
Lire aussi :
Des outils pour optimiser ses stratégies de recherche
Nous avions, avec Philippe Bodart (Total Research & Technology, Feluy-CFIB) déploré dans un précédent numéro de BASES la baisse régulière depuis plusieurs années du nombre d’articles d’origine asiatique référencés dans les bases de données/agrégateurs/serveurs occidentaux ».
Le producteur de Chemical Abstracts Services nous avait à cette occasion, expliqué que le nombre de brevets déposés dans cette zone croissait fortement et qu’ils avaient, au moins pour un temps, privilégié les brevets par rapport à la littérature. Les références à cette dernière étant supposées, à terme, ré-augmenter suite à l’embauche de nouveaux experts.
Nous avions annoncé alors que nous explorerions les bases de données de certains de ces pays avec l’aide du bureau Asie de l’OEB (Office Européen des Brevets) à Vienne que nous tenons à remercier ici.
Lire aussi :
Forte chute des références d’articles en langue asiatique dans Chemical Abstracts
DBpia (DataBase Periodical Information Academic - https://www.dbpia.co.kr ) a été lancée en octobre 1998 sous forme d’un CD-Rom mais est passée à Internet dès l’année suivante.
De nombreux développements ont été réalisés régulièrement. Le dernier en date (en 2019), a vu une réorganisation complète du site et le remplacement du moteur de recherche.
DBpia se présente comme la première base de données de contenus académiques d’origine coréenne à destination, en priorité, des universités coréennes.
Clarivate, qui n’a rien de coréen, est une autre banque de données payante référençant des articles d’origine coréenne dans le cadre de son produit Web of Science. Elle donne accès aux références de plus de 1,4 million d’articles parus dans plus de 2 500 publications, qui constituent la KCI Korean Journal Database produite par la National Research Foundation of Korea.
Auteur : François Libmann, Directeur de BASES Publications
La « Korean Association of Medical Journal Editors » (KAMJE) offre une série de services gratuits donnant accès au contenu de publications coréennes couvrant la médecine, les soins dentaires, les soins infirmiers, et les soins vétérinaires, ainsi que la nutrition.
On peut considérer que le point central est la base de données d’abstracts KoreaMed qui, en août 2017, référençait plus de 260 000 articles publiés par 256 éditeurs membres de KAMJE (derniers chiffres disponibles).
Pour l’année 2019, on trouve plus de 12 000 références dont environ 9 000 à des publications en anglais et environ 3 000 à des publications en coréen.
Dans KoreaMed, on dispose d’une recherche simple et d’une recherche avancée laquelle permet de combiner plusieurs lignes de recherche avec les opérateurs AND, OR ou NOT. Dans chaque ligne, on a le choix entre la recherche dans tous les champs ou bien de choisir dans une douzaine de champs. On dispose aussi de filtres, en particulier sur la langue de l’article, anglais ou coréen.