Un écosystème en transition : entre pillage massif, rééquilibrages juridiques et premiers modèles sous droits
L'IA générative ne se contente pas de « produire du texte ». Elle recompose le cadre même dans lequel l'information circule, est transformée et prend de la valeur.
Après quelques décennies d'un écosystème hybride, mêlant presse sous droits, bases professionnelles, web ouvert et intermédiation dominante de Google - un nouveau paysage se dessine, où des agents IA, encore largement alimentés par du scraping massif des contenus, souvent dénoncé comme une forme de captation non autorisée par les éditeurs, pourraient à terme fonctionner sur des corpus contractuels négociés.
Mais cette transition est loin d'être accomplie. Nous sommes dans un « entre-deux » instable où se côtoient pillage, litiges, opacité technique et premières tentatives de régulation. Les enjeux sont cruciaux pour les éditeurs, les professionnels de l'info-doc, les journalistes et, plus largement, l'ensemble des usagers.
D'un écosystème hybride à un accès algorithmique aux contenus
Contrairement à l'idée parfois avancée d'un « avant » dominé par un web ouvert, l'écosystème informationnel qui a précédé l'IA générative était déjà profondément hybride. Une large part des contenus reposait sur des dispositifs sous droits : presse payante, agences, agrégateurs, bases professionnelles.
Cet univers, structuré par des licences et des usages encadrés, était gouverné par des éditeurs, des institutions réglementaires et des professionnels de l'information qui en assuraient la cohérence juridique et documentaire.
À côté de cet espace contractuel existait le web ouvert, un territoire libre d'accès et riche en signaux documentaires, où la traçabilité des pages, l'identification des auteurs, la présence des liens et la possibilité de suivre la circulation des contenus constituaient autant de repères essentiels.
Entre ces deux pôles se tenait Google, une interface quasi incontournable. Son modèle économique basé sur la publicité créait de tensions fortes avec les éditeurs, imposait de nouvelles dépendances économiques et influençait parfois très négativement les stratégies éditoriales. Pourtant, malgré ses effets ambivalents, Google garantissait au moins une certaine forme d'échange : il permettait la visibilité des contenus, générait du trafic vers les sites et participait, même de façon imparfaite, à leur découvrabilité.

