Home International Les métadonnées sont de retour : le champ de bataille est désormais celui du sens et de la provenance

Les métadonnées sont de retour : le champ de bataille est désormais celui du sens et de la provenance

0 comments 34 views

L’essor de l’intelligence artificielle transforme en profondeur la manière dont l’information est diffusée et consommée, poussant les rédactions à repenser leur approche du journalisme. Au-delà de la simple publication, il devient crucial de structurer l’information de manière explicite et de garantir sa provenance pour préserver sa crédibilité dans un monde dominé par les algorithmes.

Cette nécessité de repenser les fondements du journalisme n’est pas nouvelle. Elle trouve ses racines dans les discussions tenues il y a plus de vingt ans, à Budapest, lors d’un rassemblement d’agences de presse européennes. À l’époque, le débat portait sur les métadonnées et leur rôle dans la préservation du sens de l’information dans un environnement numérique en mutation.

Peter Maarten Bakker, alors responsable informatique par intérim de l’agence de presse néerlandaise ANP, avait insisté sur l’importance de capturer le fait, le contexte et la relation entre les éléments d’une information, avant même de penser à sa publication ou à sa diffusion. Il soulignait que les métadonnées n’étaient pas une question d’efficacité, mais de légitimité, un moyen de rendre explicite la logique journalistique et de la protéger dans le flux numérique.

Aujourd’hui, cette conversation revient au premier plan, avec une urgence accrue. Dietmar Schantin décrit l’« optimisation du modèle linguistique » (LMO) comme le prochain changement majeur pour les médias d’information. L’interface dominante pour accéder aux actualités évolue vers un système de questions-réponses, où les modèles d’IA agissent comme des intermédiaires actifs, sélectionnant, combinant et formulant l’information pour l’utilisateur.

Ce changement de paradigme implique que la publication n’est plus la ligne d’arrivée, mais le début d’une seconde vie pour l’article. Cette seconde vie se déroule dans un environnement où l’information est lue par des systèmes qui ne partagent pas le même contexte culturel que les lecteurs humains, mais qui ont une influence considérable sur la manière dont le sens est transmis.

Dans ce contexte, les journalistes doivent adopter une approche plus structurée et explicite. Un journaliste travaillant sur un reportage doit désormais anticiper la manière dont son article sera résumé, comparé et mélangé à d’autres sources par des modèles d’IA. Une phrase comme « Selon des sources proches du dossier » peut être acceptable pour un lecteur, mais elle est dépourvue de sens pour un modèle de langage. Il devient donc nécessaire de préciser qui sont ces sources : fonctionnaires, parties prenantes directes, stratèges politiques.

De même, les éditeurs doivent veiller à la cohérence de la couverture, en s’assurant que les mêmes termes sont utilisés de manière uniforme et qu’il est clair ce qui relève du fait et de l’analyse. L’incohérence ne déroute pas seulement les lecteurs, elle confond également les systèmes qui reformuleront et redistribueront l’information.

L’optimisation du modèle linguistique (LMO) nécessite donc une structuration interne explicite de l’information, avec une distinction claire entre les faits, le contexte, l’interprétation et les degrés de certitude. Mais cela ne suffit pas. Il est également essentiel de garantir la provenance de l’information et de s’appuyer sur des normes transparentes.

Vincent Peyrègne propose un cadre qui distingue deux besoins fondamentaux : identifier la source et comprendre ce que représente cette source en termes professionnels. La première étape consiste à utiliser des identifiants standardisés, tels que la Coalition pour la provenance et l’authenticité du contenu (C2PA) et l’Identifiant mondial des médias, pour permettre aux machines de suivre l’origine de l’information. La seconde étape consiste à étiqueter les sources en fonction de leur adhésion à des normes telles que la transparence, l’indépendance éditoriale et la fiabilité journalistique, à l’instar de l’Initiative de confiance dans le journalisme.

En combinant ces deux approches, les rédactions peuvent créer une architecture plus robuste pour un monde axé sur les réponses. Les métadonnées, qui étaient autrefois considérées comme un détail technique, deviennent ainsi un élément central du flux éditorial, garantissant que le journalisme conserve sa légitimité et sa crédibilité dans un environnement médiatisé par l’IA. Il s’agit de définir qui définit la manière dont le journalisme est lu, compris et diffusé dans un monde où les machines co-éditent de plus en plus la mémoire publique.

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.