KB Crawl invente le "moteur de veille nouvelle génération"


Il y avait les moteurs de recherche et les outils de veille. Il faudra maintenant compter avec les “moteurs de veille”. Simple trouvaille marketing ? Pas seulement. Avec sa toute nouvelle v4, KB-Crawl a fait peau neuve.
            
Sept ans après son lancement, l’outil de veille désormais bien connu et installé chez près de 500 clients en France et à l’étranger, a subi à la fois un lifting extérieur lié à sa toute nouvelle interface au look Office 2007, mais également un changement en profondeur, basé sur des technologies Microsoft.NET.

Plus ergonomique et plus puissant, KB-Crawl peut se déployer sur trois niveaux :
            
- KB-Crawl 4, le fameux “moteur de veille”, cœur de la technologie, noyau dur et essentiel de l’offre, qui assure les fonctions de collecte et d’alerte ;
            
- KB-Crawl PLATFORM, portail de veille collaboratif.
           
- KB-Crawl SUITE, gamme de briques logicielles vendues en option : il s’agit de modules supplémentaires qui enrichis-sent les fonctionnalités de l’outil de base :
            
• KB Mail pour la gestion sophistiquée et avancée des envois de mail (KB Crawl 4 permet néanmoins l’envoi de mail, mais avec moins de possibilités) ;
             
• KB NavRecord pour paramétrer facilement la connexion au Web invisible, notamment sur des formulaires de type POST ;
              
• KB Scrapper, un module très utile qui permet de délimiter très simplement les zones à surveiller au sein d’une page.
             
Cette offre en strates fait de KB-Crawl un outil évolutif, qui peut passer du simple outil de veille personnel à l’outil collaboratif. C’est un positionnement marketing et technologique original dans le paysage des outils de veille.
             
La version 4 de KB Crawl est l’aboutissement de deux ans de R&D.
Au cœur du système, un nouveau crawler permet de collecter 100 000 documents par jour (contre 10 000 auparavant).
             
Autre nouveauté, le logiciel permet d’indexer les pages dans une langue non latine (arabe, chinois, hébreux, cyrillique…). Avec la version précédente du logiciel, les changements dans une chaîne de caractères non latins pouvaient être signalés et surlignés, mais KB-Crawl n’était pas en mesure de détecter l’apparition d’un mot-clé non latin spécifique sur une page.
             
De même, les pages archivées contenant des mots-clés en caractères non-latins ne pouvaient pas faire l’objet de recherches ultérieures.
             
C’est désormais possible, à condition toutefois d’installer l’outil linguistique sur Windows (dans le panneau de configuration).
             
KB-Crawl est maintenant capable de surveiller de nouveaux formats, tels que les e-mails, et par conséquent les newsletters reçues par ce canal.
             
Mais c’est surtout dans l’interface que les changements sont le plus visibles pour l’utilisateur. Plus ergonomique, la version 4 concentre tout en un seul écran, quand il y en avait trois différents auparavant, entre lesquels la navigation n’était d’ailleurs pas toujours intuitive car hétérogène : un pour le paramétrage, un pour les pages archivées, et un pour l’activation de la surveillance automatique.
             
Par conséquent, l’un des changements majeurs en terme d’ergonomie, réside dans la possibilité désormais offerte de pouvoir agir sur le paramétrage des sources pendant les périodes de crawl (ou de surveillance). Dans la version précédente en effet, l’utilisateur n’avait pas la main sur l’outil lorsque la surveillance de sites était programmée.
             
Dans la v4, l’interface de paramétrage, dite “watch station”, est déconnectée de la “console d’administration” qui gère les actions de surveillance, d’indexation et d’envoi des mails. C’est ainsi que KB-Crawl peut fonctionner en dehors de toute session windows. Il suffit que l’ordinateur soit allumé.
            
La barre d’outils générale, visible en haut de l’écran, présente de façon claire et organisée les principales fonctionnalités.
             
Les boutons sont regroupés par catégorie : Sources, Edition, Affichage, Crawls, Outils.
             
Un code couleur et des pictogrammes visuels contribuent à une approche intuitive de l’outil :
            
- les boutons des catégories Sources et Edition, de couleur bleue, concernent la création, la modification ou la suppression de sources ou de dossiers, l’importation et l’exportation de sources, de mots-clés, de contacts ou de favoris ;
            
- les boutons des catégories Affichage et Crawls, de couleur verte, concernent toutes les étapes de paramétrage et le crawl (lancement manuel, interruption, réinitialisation) ;
              
- les boutons colorés en orange et violet, regroupés dans la catégorie Outils, ne sont actifs que pour les utilisateurs ayant acheté les modules optionnels Scrapper et/ou NavRecord (voir plus haut).
             
L’utilisateur peut choisir d’être alerté lorsqu’une page a disparu ou est apparue, lorsque des changement de texte ont été détectés ou lorsque des mots-clés spécifiques ou une combinaison de mots-clés, sont apparus dans la page.
             
Par souci de simplification, il n’existe plus de distinction entre les motifs d’alertes (signalés à l’utilisateur au sein-même de l’interface par une icône spécifique, à côté de la source), et les motifs d’envoi d’e-mail d’alertes, qui étaient identiques aux précédents dans 99 % des cas.
             
L’utilisateur n’a donc plus a spécifier ce paramétrage redondant, ce qui est un plus.
             
En revanche on ne comprend pas bien pourquoi il n’existe pas de motif d’alerte attribué par défaut, qui consisterait par exemple à être alerté lorsqu’au moins un mot a changé.
            
A l’heure actuelle, si l’utilisateur oublie de spécifier ce motif d’alerte pourtant minimal, le crawl se fera normalement mais aucune alerte ne sera déclenchée. C’est dommage.
            
La combinaison de mots-clés est toujours possible au moyen des opérateurs AND, OR, AND NOT. On regrettera cependant la disparition de l’opérateur de proximité NEAR.
             
Dans un même souci de simplification, le paramétrage de la fréquence de surveillance (bouton Planification) a été entièrement refondu d’un point de vue ergonomique : pour chaque dossier, l’utilisateur définit une plage horaire au sein de laquelle seront effectués le(s) crawl(s) des sources du dossier. Puis, au sein de chaque source, l’utilisateur définit les jours de la semaine et la fréquence :
            
- pas de surveillance (ce qui revient à désactiver) ;
            
- surveillance quotidienne : KB-Crawl choisit l’horaire optimal au sein de la plage horaire définie ;
             
- surveillance personnalisée : pour choisir soi-même le jour et l’horaire ou augmenter la fréquence. Pour ce faire, l’utilisateur a la possibilité d’utiliser une réglette graphique qui lui permet de fixer très simplement les horaires de surveillance.
             
De notre point de vue, la définition des jours de la semaine gagnerait à être effectuée au niveau d’un dossier pour toutes les sources qu’il contient, quitte à pouvoir la modifier ensuite au sein de chaque source.
             
Nous avons remarqué enfin une petite fonctionnalité très discrète mais très utile :  la case à cocher “Afficher le texte remplacé” qui permet, à partir de la fenêtre de visualisation, de faire apparaître le texte qui a été supprimé au sein d’une page.
             
Au total, et malgré les petites réserves que nous avons émises sur le détail de certaines fonctionnalités, cette nouvelle version de KB-Crawl est très convaincante : plus facile de prise en main, le logiciel est aussi plus performant grâce à une refonte complète du programme.
           
INFORMATIONS
            
KB Crawl
10, rue Lionel Terray
92508 Rueil-Malmaison Cedex
el : +33 (0)1 41 29 05 02
             
www.kbcrawl.net



Aurélie Vathonne
Publié dans le n° 258 de Bases (Mars 2009)

Aucun commentaire:

Enregistrer un commentaire