Quand Twitter sert de relais pour trouver la réponse à une question

Enseignant-chercheur en sciences de l’information, Olivier Ertzscheid est également l’auteur du blog Affordance.info, dans lequel il partage ses réflexions, analyses et opinions sur l’actualité et l’évolution des TIC (entre autres...).

Dans un article publié le 27.11.2012 et intitulé «(My) State of Search 2012», il explique comment il a utilisé Twitter pour une recherche d’information, non pas en interrogeant le moteur de recherche du site de microblogging, mais en posant simplement la question à ses 2 776 «abonnés» (autrement dit aux 2 776 twitteurs qui le suivent et reçoivent ses tweets dans leur «timeline»).

Cette question – «Vous connaissez des auteurs qui entreront dans le domaine public en 2013 ? (= morts en 1942) please faites suivre à moi et à @Calimaq #merci » – a obtenu de nombreuses réponses, ou tout au moins des débuts de réponse. Olivier Ertzscheid a alors tenté de classer les twitteurs qui lui avaient répondu selon le type de stratégies et outils de recherche qu’ils avaient utilisés.

Il distingue ainsi (par ordre de pertinence des réponses) :

• le wikipédiste, qui explore par exemple la page Wikipédia de l’année 1942, ou la catégorie «Décès en 1942», ou encore qui utilise la recherche avancée de l’encyclopédie avec une requête comme écrivain* incategory:"Décès en 1942" ;

• le «dataïste» (jeux de mots), qui s’appuie sur le web sémantique ET les données publiques ET les institutions concernées par la question, et qui va interroger le site http://data.bnf.fr pour identifier, sur la page «L’année 1942», la rubrique «Quelques auteurs morts en 1942». Le projet Data.bnf.fr rassemble en effet autour de ses pages «auteur», «œuvre» et «thème», des ressources de la Bibliothèque nationale de France, ainsi que des ressources extérieures ;

• l’applicatiste, qui se connecte depuis son smartphone et est friand d’applications pouvant constituer autant d’alternatives à Google. Parmi celles-ci, on trouve notamment Evi, un assistant vocal (anglophone) similaire au Siri d’Apple, qui utilise un programme d’intelligence artificielle lui permettant de répondre à des questions en langage naturel. A la question «authors who died in 1942», Evi a répondu – en interrogeant Wikipédia – par une liste très importante de personnalités effectivement décédées en 1942, parmi lesquelles on trouve une majorité d’auteurs, au sens large (écrivains, poètes, essayistes, historiens auteurs de biographies, etc.). Etonnamment, cette réponse est à notre avis l’une des plus complètes, car l’application a pris en compte différents concepts gravitant autour du mot «auteur» ;

• le perfectionniste enfin, qui va interroger Persee.fr – le portail des revues françaises en sciences humaines et sociales – et qui déniche des statistiques sur le nombre de décès en 1942...

Au final, une simple question posée via Twitter à son réseau a permis à Olivier Ertzscheid d’obtenir de nombreuses réponses, mais aussi de découvrir des outils et méthodologies.

Il a alors dressé un bilan de cette recherche en particulier, bilan qui ne peut bien sûr être appliqué à l’ensemble des recherches sur Internet, mais qui trouve un écho dans les analyses que nous avons pu faire dans des articles comme «Google intègre la sémantique à ses algorithmes, avec Knowledge Graph» (Netsources n°98) ou «Cartons rouges pour Google» (Netsources n°96).

Pour Olivier Ertzscheid en effet, et dans le cas de cette recherche en particulier :

• Twitter est le nouveau Google, en ce sens qu’il renvoit vers des sites qui contiennent les réponses aux questions ; c’est ce que faisait Google il y quelques années, avant le lancement de Google Instant (voir Netsources n°87) qui lui permet de «prédire» les réponses avant que les questions ne soient posées ;

• mais Twitter n’est pas «seulement» le nouveau Google, parce qu’en plus de renvoyer vers des sources, il ajoute «ses propres niveaux de qualification sur les sources vers lesquelles il pointe ou sur les éléments de réponse qu'il livre, permettant de gagner ainsi un temps précieux et allégeant considérablement le coût cognitif de la recherche en cours» ;

• Wikipédia domine outrageusement dans les réponses (comme c’est le cas sur Google...) ;

• la sémantique – ou plutôt le Web socio-sémantique – fait son apparition.

Ce Web allie «la puissance de la recommandation d'une audience "qualifiée"» – car construite autour d’une communauté d’intérêt, composée des «abonnés» et des «abonnements» du twitteur – et «l'extraction de plus en plus fine et efficiente de données permettant des parcours sémantiques».

Ces observations sont pour Olivier Ertzscheid la confirmation que le Web de demain sera celui des connaissances déclaratives (le Web des données) et celui des connaissances procédurales (la sémantique associée aux données).

Mais il lui faudra passer par l’humain. Car – et c’est sa conclusion – «seul un humain est capable de "qualifier" le dosage nécessaire entre le déclaratif et le procédural pour mener à bien une requête dans un contexte de tâche donné (que ladite tâche soit explicite ou implicite).

Seul un humain. Seules des interactions entre humains. En tout cas pour l'instant...

Des données, de la sémantique et des hommes. C'est peut-être cela le Web 3.0».

C’est ce que pense à sa manière Google, qui intègre désormais dans son algorithme les données et la sémantique (avec le Knowledge Graph) et qui place l’utilisateur au centre des résultats (avec Google+)...

PLUS D’INFOS

• (My) State of Search 2012. Olivier Ertzscheid, Affordance.info, 27.11.2012. http://goo.gl/R4506.

• On trouvera dans l’article «Méthodologie : de l'intérêt de Twitter pour des recherches en temps réel ; retour sur l'exemple Diigo.com», paru sur le Blog de Recherche-eveillee.com le 26.10.2012 (http://goo.gl/J69XH), un autre exemple de méthodologie de recherche utilisant Twitter.



Béatrice Foenix-Riou
Publié dans le n° 100 de Netsources (Septembre-Octobre 2012)

Aucun commentaire:

Enregistrer un commentaire