Art et numérique : la data au service des provenances ? Bilan et problématiques de la journée d’études du 11 mai 2026

Le 11 mai dernier, l’Observatoire des humanités numériques organisait à l’École normale supérieure (ENS) une journée d’études consacrée à l’impact des technologies numériques sur la recherche de provenances des biens culturels. À travers les interventions de chercheurs, de conservateurs et d’acteurs du marché de l’art, de multiples problématiques ont émergé, révélant que le numérique constitue une avancée fondamentale tout en engendrant de nouveaux défis méthodologiques, juridiques et technologiques. Organisée sous la houlette de Margaux Dumas et de Léa Saint-Raymond, directrice de l’Observatoire des humanités numériques de l’ENS-PSL, cette journée a réuni un panel d’intervenants aux expertises particulièrement complémentaires. Pour aborder la recherche de provenance sous tous ses angles, l’événement a ainsi croisé les regards de chercheurs et universitaires internationaux (comme Amr Al-Azm ou Ronan Bretel), de professionnels des musées et de la documentation (telles que Catherine Chevillot pour le Service des musées de France, Yaëlle Biro de l’INHA, ou Élodie Roy du Musée des Beaux-Arts de Lyon), et de spécialistes de la donnée (Pierre-Yves Laborde, Albina Toumarkine). Les institutions et le marché de l’art étaient également fortement représentés pour confronter ces approches à la réalité du terrain, avec la présence d’experts judiciaires (Daniel Lebeurrier), d’assureurs (François de Carvalho d’AXA XL), ainsi que de Pierre Taugourdeau, Secrétaire général du Conseil des maisons de vente.

Affiche de la journée d’études « Art et numérique : la data au service des provenances ? ». (©Observatoire des humanités numériques, ENS-PSL).

Les réseaux sociaux et l’IA : les deux visages du trafic illicite

Au début de la conférence, le professeur Al-Azm de la Shawnee State University et du projet ATHAR a noté que la technologie numérique fonctionne comme une “arme à double tranchant”. Elle facilite le trafic illicite de biens culturels et l’utilisation des réseaux sociaux, en particulier Facebook, augmente considérablement le commerce d’antiquités pillées. Amr Al-Azm a ainsi documenté une hausse de près de 500 % de l’activité en ligne en Syrie depuis 2011. Les réseaux sociaux tirent profit de ce trafic grâce aux revenus publicitaires, générés par la consultation des annonces sur la marketplace de Facebook. Pour lutter contre ce problème, le projet ATHAR utilise l’investigation en sources ouvertes pour traquer les objets pillés. Cependant, l’extraction à grande échelle des données de Facebook s’avère impossible. La collecte doit donc se faire manuellement afin de garantir le bon contexte, ce qui est très chronophage. Pour surmonter cette limitation et transformer les données dispersées en informations utiles, le projet ATHAR a construit un système d’IA personnalisé basé sur Claude AI. Ce système permet de lier les artefacts aux publications numériques et de créer des connexions possibles avec des réseaux extrémistes.

De l’archive au numérique : structuration et contraintes juridiques

La mise en ligne des données de provenance pose des défis légaux et sémantiques aux institutions muséales. Élodie Roy et Ronan Bretel ont souligné que l’intégration d’une œuvre dans les collections requiert un équilibre entre transparence et respect de la vie privée des donateurs vivants. Cela nécessite parfois d’anonymiser les bases de données publiques tout en conservant des informations sur les logiciels internes des musées. De plus, la numérisation des œuvres impose une gestion stricte des droits d’auteur, car les bases de données sont elles-mêmes protégées en tant qu’œuvres de l’esprit. Les musées doivent aussi garantir les droits des photographes institutionnels et faire attention aux licences Creative Commons lors de la diffusion en Open Data, souvent sous la supervision d’organismes comme Etalab. La question du vocabulaire pose également un problème majeur pour l’archivage numérique. L’évolution de la sémantique impose de lier les termes anciens et potentiellement dépassés, imprécis ou offensants, des exonymes donc, comme les expressions “Empire Romain” ou ”esquimau” par exemple, aux termes contemporains (“inuits”) afin de préserver la traçabilité des recherches documentaires. L’utilisation de thésaurus spécialisés comme Opentheso aide à structurer cette complexité historique.

L’intelligence artificielle pour l’extraction : promesses et limites

Les numérisations progressent : avec la grande quantité d’archives disponibles, l’IA est de plus en plus utilisée pour traiter la documentation. Les travaux présentés par Léa Saint-Raymond, Albina Toumarkine et Pierre-Yves Laborde montrent comment des outils basés sur l’apprentissage profond et la reconnaissance optique de caractères permettent de segmenter automatiquement des catalogues de ventes aux enchères. Des projets comme Aucase ou DataCatalogue réussissent à extraire des listes de notices, des dates et des images pour restructurer numériquement d’anciennes ventes. Cependant, l’extraction automatisée fait face à des limites structurelles. Cela inclut des erreurs d’alignement dans les sections d’un catalogue, des corpus numérisés incomplets, ou l’incapacité d’interpréter des données erronées. Les intervenants ont mis l’accent sur l’importance de l’œil du chercheur ! Une approche semi-automatique et une vérification par le spécialiste à chaque étape restent essentielles pour nettoyer et valider les données historiques.

Fiabilité du numérique et nouveaux horizons du marché de l’art

La dernière partie de la journée a questionné la fiabilité de la chaîne numérique pour les acteurs du marché de l’art et les assureurs. Daniel Lebeurrier et François de Carvalho ont rappelé que les bases de données institutionnelles (Interpol, TREIMA…) reposent largement sur du déclaratif. Elles ne peuvent pas en soi différencier un objet authentique d’un faux. Le risque de falsification augmente avec les modèles de langage génératifs comme GPT, par définition (Generative Pre-trained Transformer). Ces systèmes, entraînés sans distinction parmi les données du web, peuvent produire des erreurs en série et ainsi falsifier des parcours de provenance, les “halluciner” en langage IA. Si une IA génère de faux certificats d’authenticité, ces deepfakes peuvent être pris en compte et reproduits par d’autres systèmes. Demain donc, le coût de l’IA est probablement appelé à baisser, mais celui des indispensables vérifications humaines risque, lui, d’exploser. De même, la blockchain et les puces NFC sont utiles pour tracer des œuvres, mais elles ont des inconvénients. L’environnement numérique peut être frauduleux dès la création du jeton, ou la puce peut être altérée par des trafiquants, affectant éventuellement la matérialité de la pièce elle-même.

Malgré ces défis, l’intégration du numérique s’accélère. Des outils gratuits et informatifs comme ResProvMus ou le Vademecum des recherches de provenance de la M2RS visent à démocratiser et à améliorer ces démarches. Pour les commissaires-priseurs, la quête actuelle est celle du logiciel unique, un “mouton à 5 pattes” qui combinerait la gestion des stocks, la tenue du livre de police numérisé, l’automatisation du catalogage et la connexion directe avec les bases d’objets volés. Même si le numérique et l’IA sont cruciaux pour traiter le volume croissant d’informations, l’interprétation finale et la certification des provenances restent la responsabilité des experts et des chercheurs.

Pour poursuivre et élargir ces réflexions fondamentales, le premier colloque organisé par la chaire Unesco de l’École du Louvre, intitulé “Pour une histoire globale de la recherche de provenances. Dimensions historique, méthodologique, juridique, politique et philosophique”, se propose de porter un regard rétrospectif sur les conditions d’émergence de la recherche de provenances et sur les raisons de son caractère incontournable aujourd’hui, tant dans la gestion des collections muséales et la recherche en histoire de l’art et de l’archéologie, que dans les relations internationales. Il se tiendra à l’École du Louvre les 22 et 23 juin 2026.

Image à la une : Affiche de la journée d’études « Art et numérique : la data au service des provenances ? ». (©Observatoire des humanités numériques, ENS-PSL).

Cet article est publié sous les conditions mentionnées dans notre clause de non-responsabilité / This article is published under the conditions expressed in our disclaimer.

Auteur/autrice

Previous post Atelier international – Le cadre juridique belge de la restitution des biens spoliés pendant la Seconde Guerre mondiale