119 ans d'archives du Financial Times en ligne


Après l’annonce faite au Online de Londres, les archives du Financial Times sont désormais disponibles en ligne.
La période couverte va de 1888 (l’origine) à 2006 et s’accroît d’un an chaque année.
             
Proposé par Gale, une filiale de Cengage Learning, la banque de données est réalisée à partir de l’océrisation des numéros papier (éventuellement après repassage, car c’est le moyen le plus efficace de lisser le papier des numéros anciens !).
           
L’ensemble représente environ 790 000 pages, dont tous les éléments sont cherchables, articles  comme publicités et petites annonces. Sont inclus les suppléments et le FT Magazine.
            
Il sera par ailleurs possible prochainement de chercher en même temps le Financial Times, le Times et The Economist. Ce dernier sera disponible pour la période 1843-2003, puis dans un deuxième temps jusqu’en 2006.
           
Nous avons été agréablement surpris par la variété des possibilités de recherche offertes par ce système.
            
Il existe bien sûr une recherche simple, qui permet de limiter la requête au Keyworks/mots des titres et sous-titres et auteurs, ou de lancer la recherche sur le plein texte. On peut aussi limiter par date.
            
La recherche avancée offre beaucoup plus de possibilités.
             
On peut combiner plusieurs lignes de recherches séparées par un des trois booléens, au choix. A l’intérieur, on dispose des booléens, d’opérateurs de proximité, de masques et de troncatures.
             
Pour chaque ligne on peut, si nécessaire, limiter la recherche à un champ.
             
On peut aussi limiter par date et par type d’information, mais cette dernière possibilité ne nous a pas entièrement convaincu.En revanche, une option intéressante est de faire appel à trois niveaux de logique floue (fuzzy) – low, medium ou high –, pour tenir compte du fait que l’océrisation ne donne pas des résultats fiables à 100 % pour les documents anciens.
            
 Pour tester cette possibilité, nous avons entré le mot harbor (port en américain) dans le titre/sous-titre, qui donne 12 réponses.
             
Le premier niveau de flou donne 1 890 réponses, essentiellement trouvées avec le mot harbour (port en anglais).
            
Le deuxième niveau donne 5 877 réponses et le troisième 37 113. Nous ne connaissons pas l’algorithme utilisé dans ce dernier cas, mais il balaie manifestement très large.
           
Les réponses apparaissent avec titre, date, nombre de mots et catégorie de document. Un clic sur le titre fait apparaître l’article avec, parfois,  le mot de recherche surligné en vert.
             
Comme le texte n’est pas toujours très lisible pour les documents anciens, il est possible de l’agrandir très facilement.
             
On peut, à partir d’un article, obtenir les titres des autres articles d’une même édition ; on peut aussi obtenir une citation “propre” d’un article, que l’on peut sauvegarder ou mettre dans un bookmark avec l’adresse de la page.
             
Les universités et les organismes publics peuvent acheter l’ensemble des archives, sinon le coût d’une souscription annuelle se compte en centaines d’euros, selon le profil du client. Il n’y a malheureusement pas d’autres options que l’achat ou la souscription annuelle.
             
Cette nouvelle banque de données illustre le fait que l’on trouve de plus en plus souvent des archives anciennes des grands journaux de différents pays.
             
En France, les archives en ligne du quotidien Le Monde par exemple ne remontent qu’à 1987 et celles de La Tribune et des Echos au début des années 90.
             
Citons néanmoins la présence, dans Gallica – la bibliothèque numérique de la BnF, voir Bases n°256 –, d’archives d’une trentaine de titres de la presse quotidienne nationale, entre le milieu du XIX et le milieu du XXème siècle
             
INFORMATION
           
www.gale.cengage.co.uk
 

Aucun commentaire:

Enregistrer un commentaire