Medialogia : une analyse sémantique de plus de 8 000 sources

Les banques de données russes sont peu connues des entreprises françaises, et pourtant elles sont une arme indispensable pour comprendre un marché complexe et s’y déployer de la façon la plus sûre possible.

Au regard de l’immensité des ressources d’information russes, et notamment de la presse russe, ce serait à notre avis une grave erreur de se limiter aux sources anglophones – bien pauvres en comparaison – et de ne pas se donner les moyens de surmonter la barrière linguistique, indéniable certes, mais gérable.

Une autre raison de découvrir le monde russe de l’informa-tion est que la Russie, forte de sa tradition documentaire et de sa puissance de développe-ment informatique, possède d’importants serveurs de presse, dont les fonctionnalités n’ont rien à envier à leurs concurrents occidentaux.

Medialogia compte parmi ces grands serveurs.

Depuis 2003, date de sa création, il se distingue par un positionnement marketing spécifique.

En effet, outre une fonction de serveur de presse classique, permettant la recherche et la veille, il a été développé avec comme cible principale les services de communication et relations publiques des entreprises et/ou autres organisations (dont les partis politiques).

Gérer au quotidien l’image d’une organisation, d’une marque, d’une personnalité, gérer les relations presse, les situations de crise, évaluer l’efficacité d’une campagne de presse... sont autant d’utilisations possibles du produit, spécialement développé avec l’aide de linguistes et spécialistes media et relations publiques.

AU CŒUR DU PRODUIT

La pièce maîtresse de ce serveur est un module d’analyse sémantique, structuré autour de deux notions essentielles :

- une notion d’objet, que l’on peut rapprocher des «entités nommées», à savoir une entité publique, physique ou juridique repérée automati-quement et extraite par le système, à partir de l’analyse de la presse.

Medialogia contient plus de 30 000 objets dans la sphère économique, politique, sociétale, en Russie mais aussi dans le monde. Il est important de noter que les résultats obtenus via l’analyse automatique sont vérifiés et corrigés par une équipe d’experts ;

- un indice media MI® en anglais  (............®  en russe), que l’on pourrait traduire par «indice de réception favorable».

Cet indice est un indicateur qualitatif qui traduit la représentation de l’objet dans les media  et est calculé pour chacun d’eux dans chaque article. L’indice varie de -1.000 à +1.000 selon la tonalité positive, négative ou neutre de l’article. Plus l’indice est élevé, plus la couverture médiatique de l’objet est positive et met en valeur celui-ci.

CIBLAGE DES ACTIONS DE RELATIONS PUBLIQUES ET OUVERTURE SUR L’ENTREPRISE

Il est dès lors possible, à partir de la détection automatique de ces fameux objets (personnalités, sociétés, marques…), de découvrir les liens cachés entre eux, d’évaluer très finement, pour chacun d’entre eux,  la part d’appréciations positives ou négatives dans tous les types de médias (presse, internet, TV, radio…), d’évaluer et de comparer l’attitude et les relations des différents médias et de chaque journaliste par rapport aux différents objets, avec en outre des représentations graphiques variées.

Dans son argumentaire commercial, Medialogia valorise habilement les bénéfices que l’outil peut apporter aux différents services de l’entreprise, pour le développement et la protection du business.

Il s’adresse ainsi au marketing et ventes,  aux services d’intelligence économique et de sûreté, mais l’une de ses cibles de choix est le dirigeant, qu’il soit d’entreprise ou politique. Plusieurs solutions dédiées ont ainsi été développées pour permettre à celui-ci de suivre en temps réel les sujets de son choix, dans les news et les médias sociaux.

UN SPECTRE DE MEDIA TRES LARGE

Medialogia contient plus de 8 000 sources avec une antériorité remontant à l’année 2000, 30% d’entre elles étant composées de la version électronique des journaux et magazines (médias fédéraux, régionaux, sectoriels, étrangers, presse féminine), et 50% des sources étant exclusivement Web. 

Plus de 200 chaînes de télévisions et une centaine de radios sont couvertes, avec une très bonne représentation régionale et avec, pour les principales télévisions fédérales, l’accès aux versions textuelles des programmes, une heure après leur diffusion en direct, et la possibilité de regarder directement les émissions télévisées. Plus de 300 agences de presse et les 1000 blogs les plus influents sont suivis.

La presse fédérale est en ligne dès cinq heures du matin en version PDF.

Parmi les sources prises en compte par Medialogia, 36% sont régionales et 30% sont spécialisées.

La couverture des médias des pays de la CEI et des Pays Baltes est bien représentée, avec plus de 10%. La presse étrangère est présente, même si elle est faiblement couverte : 5% (pour la France, on trouve Le Monde, Libération, Paris Match…).

UNE INTERFACE DE RECHERCHE CONVIVIALE ET SOPHISTIQUEE

L’utilisateur est d’emblée pris en main et guidé par un schéma de recherche bien précis, organisé autour de trois grandes questions Quoi ? (définissant l’objet de la recherche), Où ? (les types de médias, les pays…) et Quand ? (il est possible ici d’entrer la date de publication ou la date de mise à jour dans le système).

Ces trois questions sont graphiquement mises en évidence dans le menu et autour d’elles sont regroupées toutes les fonctionnalités de recherche, dont la richesse autorise l’élaboration de requêtes qui peuvent être sophistiquées. Toutes les requêtes peuvent être stockées et partagées via des dossiers.

On notera que la question Quoi ? donne accès soit à la recherche par objet, soit à la recherche contextuelle.

La recherche par objet, qui renvoie à la notion précédemment décrite, permet d’entrer un premier mot ou première forme de l’objet, que le système va préciser en allant chercher le ou les différents objets similaires figurant au catalogue, pour les proposer avec une notice descriptive.

Toutes les écritures possibles d’un mot sont admises, incluant les abréviations, l’écriture en lettres latines et même les erreurs : si l’on tape par exemple le mot Price, on retrouvera PwC, Pricewaterhouse Coopers ou Pricewater-houseCoopers (avec ou sans espace) et Pricewoterhouse Coopers.

La prise en compte également de l’environnement du mot permet la désambiguation des objets, en particulier des homonymes.

La deuxième option, la recherche contextuelle, permet la recherche par mots clés, avec les opérateurs classiques incluant le «atleast» et une gestion performante des déclinaisons et des formes des mots propres à la langue russe.

UNE PUISSANCE DE TRAITEMENT DES DONNEES

C’est la visualisation et le traitement des résultats issus des requêtes qui nous montrent toute la puissance du produit et sa spécificité. Cinq onglets permettent d’afficher et d’interpréter les résultats sous des angles de vue très différents : liste des résultats, dynamique (courbes, dont celle du fameux indice media MI®), analyse des objets, analyse des sources et analyse géographique.

Le plus souvent, les données d’analyse peuvent être éditées sous forme de tableau ou sous forme de graphes.

L’interactivité est un principe généralisé, avec notamment l’accès aux données à partir des représentations graphiques.

En ce qui concerne l’affichage des résultats, ils peuvent être – fonctionnalité intéressante – regroupés par «événements », quand les articles portent sur le même sujet, ou encore être triés et affichés selon des rubriques thématiques.

Un article s’affiche toujours, qu’il soit en version texte ou PDF, avec un petit diagramme où apparaissent les différents objets textuels, avec l’affichage, d’un clic, de leurs différentes écritures et/ou composantes surlignées dans le texte.

Les objets sont bien sûr au cœur de l’analyse : on connaît pour chacun le nombre d’articles positifs ou négatifs qui s’y rapportent et l’indication de leur statut (rôle principal ou citation) ; ils sont d’autre part représentés graphiquement et classés selon différents critères (quantité, attributs positifs, négatifs et neutres, indice media MI®, …).

Les sources font elles aussi l’objet de multiples traitements.

Les données agrégées sont triées suivant différents types et catégories de sources et le corpus media est analysé selon des critères aussi bien quantitatifs que qualitatifs (indice media, visibilité des objets, etc). Les journalistes et leurs opinions peuvent être aussi finement analysés.

Enfin, la représentation graphique du volet «géographie» impressionne, avec la représentation des données sur une immense carte, avec répartition possible par régions, districts de la fédération de Russie, villes, pays de la CEI...

Medialogia accorde, on l’a vu, beaucoup d’importance à la représentation et à l’analyse des données, comme en témoignent également les formats de rapports de veille proposés par le système pour l’exportation des données.

On pointera pour exemple les rapports-types d’analyse pouvant être élaborés à partir de la surveillance des blogs et que l’on trouvera à l’adresse : http://goo.gl/2Ls5I.

Aujourdhui, Medialogia occupe une place de choix parmi les fournisseurs d’information en Russie, en se positionnant comme un outil résolument moderne, à la fois base de données et outil d’analyse media.

Mais il tire également avantage des capacités du système en jouant un rôle dans la sphère médiatique russe via la publication des ratings de titres de presse dans les différentes régions ou inversement des régions dans la presse, dans les secteurs industriels et les services, des personnalités…

Fin 2011, Medialogia a ainsi publié un rating des bloggeurs les plus cités dans les media et un autre sur les femmes russes les plus influentes sur l’année 2011, que l’on pourra consulter à l’adresse suivante : http://goo.gl/WzBq4.   



Anne-Marie Libmann
Publié dans le n° 291 de Bases (Mars 2012)

Aucun commentaire:

Enregistrer un commentaire