Le nouveau Northem Light


Le nom de Northern Light n’est pas inconnu de ceux qui ont commencé à utiliser Internet il y a une quinzaine d’années. Créé en 1995 ou 1996 selon les sources, Northern Light avait lancé dès 1997 un moteur de recherche présentant deux originalités.

La première était qu’outre le contenu gratuit du Web, il donnait accès au contenu (payant) d’une «Special Collection», composée de 1800 titres. Les résultats étaient d’autre part regroupés par concepts, qui pouvaient concerner le thème, le type de document, la source ou la langue («Un nouveau concept de recherche pour le moteur NorthernLight», Netsources n°10, septembre-octobre 1997).

Début 2002, Northern Light décida de fermer l’accès gratuit à son moteur de recherche, pour se concentrer sur le marché des entreprises.?Deux semaines après ce choix, il fut racheté par Divine Inc., une société créée en 1999, entrée en Bourse en 2000, et qui avait une politique d’achat de sociétés particulièrement offensive – elle racheta notamment l’agence d’abonnement Rowecom –.

Ce rachat devait permettre à Northern Light de profiter de la force de frappe des 300 vendeurs de Divine.

Mais le management catastrophique de Divine conduisit rapidement le groupe à la faillite*.

C David Seun, l’ancien PDG de Northern Light, réussit en juillet 2003 à racheter la société à la barre du tribunal, pour un montant de 81 000 $, soit ... un demi pour cent environ de ce qu’avait payé Divine pour l’acheter en 2002 !

La nouvelle équipe construisit une nouvelle version de son Business Search Engine, qui devint accessible au public en septembre 2006.

Elle développa aussi un «Single Point Market Research Portal», permettant de rechercher de façon sophistiquée dans le contenu des études de marché.

Mais finalement, Northern Light abandonna – pour un temps – le créneau du moteur de recherche librement accessible et se concentra sur l’activité de développement de plateformes, destinées à de grandes entreprises ou de grands organismes.

Ces plateformes peuvent agréger le contenu interne de l’entreprise, des contenus externes librement accessibles (PubMed, les brevets de l’USPTO, les appels d’offres de FedBizOps...) et des contenus externes payants, sélection-nés par le client (études de marché, presse, agence de presse...).

Northern Light?Business News notamment offre aux clients de la plateforme un accès illimité à 8000 sources online, proposant 25 000 articles par jour, certains moins de 30 min. après leur publication.

Toutes les fonctionnalités classiques – recherche, coopération, administration... – de telles plateformes sont disponibles, mais l’originalité tient à l’outil de text mining MI Analyst, développé par Northern Light.

Dans un article intitulé «In-Depth Understanding: Teaching Search Engine to Interpret Meaning» publié en avril 2011 dans les «Proceedings of the IEEE» (http://goo.gl/62z6O), C.David Seuss explique sa démarche, qu’il considère comme innovante.

Il estime d’abord qu’il n’y a pas eu d’innovation radicale dans les moteurs de recherche entre 1994 et 2011.

Prenant l’exemple d’une recherche sur l’analyse de la stratégie de Cisco System dans le domaine de la téléphonie sur IP (VOIP), il formule sa question en écrivant «Cisco AND VOIP» dans un corpus de rapports d’analystes.

Il trouve évidemment un très grand nombre de réponses, qu’il est incapable de trier à la main dans un temps raisonnable, faute d’outils adaptés.

Il en déduit qu’il faut utiliser des outils extracteurs de sens («meaning extractions») pour identifier les concepts et les entités nommées.

Il est évident qu’il n’est pas le seul à avoir développé de telles approches et on peut lui faire crédit d’une bonne qualité de son outil sans l’avoir, néanmoins, testé précisément.

On remarquera au passage que cela ressemble beaucoup à une indexation automatique et que le concept d’indexation, manuelle certes, ne date pas d’hier.

Mais ici, l’indexation ne sert qu’à classer les documents, pas à les rechercher.

La démarche proposée par Northern Light – et que nous avons déjà rencontrée chez d’autres outils – consiste à ne pas partir d’une stratégie de recherche complexe, comme on peut le faire sur les serveurs/agrégateurs classiques, mais d’une stratégie très simple.

Celle-ci génère bien sûr  des résultats – en général en grand nombre –, mais aussi et surtout des concepts, extraits des résultats trouvés – un peu à la façon du moteur Exalead, qui affiche en complément des résultats la liste des «termes associés», obtenue par une analyse statistico-sémantique des résultats pertinents.

La suite de la démarche consiste alors à choisir parmi les concepts proposés, jusqu’à obtenir un ensemble de résultats considérés comme satisfaisants.

Pendant un an, l’offre de Northern Light fut uniquement constituée de plateformes sur-mesure.

Interviewé par Stephane E. Arnold en juin 2008, C. David Seuss citait Hewlett Packard comme client et des prix annuels en général autour de 100 000 $, mais pouvant aller jusqu’à 400 000 $.

RENAISSANCE DU MOTEUR DE RECHERCHE

En avril 2008, Northern Light relança son moteur de recherche gratuit, à l’adresse www.nlsearch.com.

Ce moteur n’interroge qu’une partie des sources de Northern Light Business News et n’offre, également, qu’une partie des fonctionnalités de la plateforme.
  
Ce moteur orienté business est toujours disponible et permet – comme la plateforme – d’analyser et d’affiner le résultat de ses recherches.
  
On peut même, en s’inscrivant gratuitement, recevoir des alertes personnalisées ou des alertes publiques partagées.
 
La recherche, limitée aux 90 derniers jours, peut se faire dans le texte ou le titre et être limitée à certaines sources ou types de sources (Business & Technology News, Industry Authority Blogs, US Regional News...).
   
On peut utiliser booléens, masques et troncatures, exiger qu’un terme soit présent (+) ou absent (–).

On peut, dans un second temps, utiliser les résultats de l’analyse et du classement par dossiers pour préciser sa recherche.
             
UN PRODUIT SUR ETAGERE

La nouveauté est le lancement début avril du «Northern Light Discovery for Life Sciences Conference Abstracts», qui est un nouvel outil de recherche baptisé «Discovery Portal».

Contrairement à l’offre précédente, ce nouveau produit est disponible «sur étagère» et il n’est pas prévu d’adaptation personnalisée – sauf à utiliser la plateforme «Single Point Strategic Research Portal», qui est entièrement sur-mesure.
   
Le point-clé qui fait toute l’originalité du produit est la mise à disposition rapide des abstracts de conférences scientifiques et surtout des posters, qui sont en général très difficiles à identifier.

Ils sont d’autant plus intéressants qu’on peut y trouver, avec plusieurs mois ou années d’avance, des informations qui ne seront développées que plus tard, ou même la présentation d’hypothèses qui seront abandonnées et dont on ne trouvera plus la trace.

La recherche, limitée aux derniers 18 mois, se fait sur 148 000 résumés de conférences ou posters, plus de 1,3 million de documents de recherche issus de PubMed/Medline, de brevets concernant les sciences de la vie, de documents provenant du registre des essais cliniques (ClinicalTrials.gov) et de 200 000 actualités issues de 8 000 sources environ.

On trouve aussi un calendrier des conférences à venir dans le domaine et un annuaire des 100 plus importantes sociétés dans le domaine des sciences de la vie.

Pour chacune, on trouve une série de liens vers différentes parties du site de la société, ses communiqués de presse, son rapport annuel, les actualités les plus récentes la concernant et les présentations faites par Hoovers, MarketWatch, Reuters et Yahoo! Finance.

On trouve aussi la liste de 362 conférences couvertes par Northern Light – à l’heure où nous écrivons ces lignes –, avec un lien vers la liste de tous leurs abstracts et posters.

Outre la liste des conférences ou le «Company Radar», on choisit de rechercher dans les résumés des conférences, la «Scientific Research» ou les actualités.

On peut utiliser dans la zone de saisie opérateurs booléens et opérateurs de proximité, masque et troncature.

Les résultats s’affichent avec la référence bibliographique et des extraits de l’abstract autour des mots de recherche.

Sur la colonne de gauche, on dispose des concepts obtenus avec MI Analyst : Drugs, Brand Name Drugs, Diseases, Human Autonomy, Thera-peutic Areas...

On peut alors sélectionner le(s) terme(s) de son choix, ce qui affine les résultats.

Un clic sur le titre affiche le résumé ou le poster.
  
Un deuxième produit de même nature va être lancé ces prochains mois. Il concernera les technologies de l’information.

Ce décalage doit permettre à Northern Light de se consacrer pleinement pour le moment à ce produit sur les sciences de la vie.
  
En ce qui concerne les tarifs, on est totalement à l’opposé du moteur de recherche gratuit.
   
Le Life Science Discovery Portal est en effet disponible dans deux configurations : la première jusqu’à 100 utilisateurs et la seconde pour un nombre illimité d’utilisateurs. La société n’a pas souhaité nous communiquer de tarifs.

Les responsables de Northern Light n’ont pas voulu nous communiquer de prix, mais on peut imaginer que cela est parfaitement inaccessible pour un consultant indépendant...



François Libmann
Publié dans le n° 293 de Bases (Mai 2012)



Aucun commentaire:

Enregistrer un commentaire