Les papyrus d'Herculanum, un ensemble de parchemins carbonisés par l’éruption du Vésuve, commencent enfin à être déchiffrés grâce à un projet d’intelligence artificielle en open source. Il s’agit d’un exemple édifiant du potentiel des nouvelles technologies dans des domaines tels que l’archéologie.
Après avoir survécu à l'éruption du Vésuve en l'an 79, les papyrus ont été découverts accidentellement par un ouvrier qui forait un puits au début des années 1700. Depuis, de nombreuses tentatives visant à les déchiffrer sont compliquées par la fragilité des parchemins, qui s'effritent si l'on tente de les dérouler. Les morceaux comportant des traces d'écriture, eux, étaient jusqu'alors considérés comme illisibles à l'œil humain. L'IA vient de changer la donne.
Un concours pour une recherche en open source
En 2015, des chercheurs de l'université du Kentucky, dirigés par le docteur Brent Seales, ont utilisé la vision par ordinateur pour « ouvrir » virtuellement les rouleaux. Quatre ans plus tard, la tomodensitométrie tridimensionnelle, technologie également utilisée pour réaliser des scanners dans la médecine moderne, a permis de générer une image virtuelle complète des papyrus. Deux entrepreneurs fascinés par ce trésor archéologique, Nat Friedman et Daniel Gross, ont alors décidé de financer un concours baptisé le Vesuvius Challenge pour inviter un maximum de personnes à participer à la recherche, qui s'effectue en open source.
« Grâce à l'ouverture des données et à la mise en place d'incitations appropriées, les participants ont pu explorer beaucoup plus d'idées qu'une petite équipe d'universitaires n'aurait pu le faire dans le même laps de temps », commente JP Prosma, un porte-parole de l'initiative. Pari gagnant, Luke Farritor, étudiant américain en informatique, vient de lire le premier mot d'un papyrus d'Herculanum non ouvert.
Pour y parvenir, il s'est appuyé sur des découvertes antérieures de « motifs de craquement » de l'encre faites par un autre candidat. Il a ensuite entraîné un modèle d'apprentissage automatique à reconnaître les motifs, ces données ont permis d'améliorer les capacités de reconnaissance du modèle. Finalement, l'IA a trouvé une formation de lettres qui constituait le mot grec « porphyras », signifiant « violet » dans l'écriture ancienne. L'étudiant a remporté 40 000 dollars.
Une valeur historique inestimable
En parallèle, un autre concurrent et étudiant en biorobotique, Youssef Nader, a reçu 10 000 dollars pour avoir trouvé le mot similaire en utilisant un autre modèle. Il a « produit les images les plus claires et les plus complètes de l'intérieur d'un rouleau à ce jour ».
En utilisant la technique de Farritor, les chercheurs espèrent en déchiffrer d'autres, ce qui équivaudrait à « deux ou trois douzaines d'Illiades ou d'Odyssées », estime JP Prosma. Les 1 100 parchemins carbonisés ont été retrouvés dans les ruines d'un bâtiment qui aurait été la maison du beau-père de Jules César. Il est probable qu'ils contiennent des textes de Philodème, un philosophe épicurien.
Ce n'est pas la première fois que l'IA joue un rôle déterminant dans une découverte archéologique. En 2021, des chercheurs ont réussi à automatiser le tri et la classification de fragments de poterie découverts lors de fouilles grâce à cette technologie.