Les Archives secrètes du Vatican rassemblent 85 km de documents | Archivum secretum vaticanum
Vatican
Les Archives secrètes du Vatican rassemblent 85 km de documents | Archivum secretum vaticanum

Le défi de la numérisation des 85 km de documents des Archives secrètes du Vatican

02.05.2018 par I.MEDIA

Regorgeant de documents clefs de l’histoire, les Archives secrètes du Vatican sont confrontées aujourd’hui au défi de la numérisation, seule possibilité pour leur permettre un véritable apport à la recherche. Réunies sur 85 km linéaires, ces archives sont une des collections les plus importantes au monde. Le projet Codice Ratio vise à en faciliter la numérisation.

Le mensuel américain The Atlantic a consacré un article le 30 avril 2018 au projet Codice Ratio, qui vise à faciliter le travail de numérisation des Archives secrètes du Vatican.

Le décret d’excommunication de Martin Luther, les minutes du procès de Galilée, ou encore la demande du roi d’Angleterre Henry VIII d’annuler de son mariage avec Catherine d’Aragon: ces documents sont tous regroupés au sein des Archives secrètes du Vatican. Réunies en 600 fonds sur 85 km de long, ces archives secrètes – c’est-à-dire privées – sont une des collections les plus importantes au monde.

Malgré le travail de l’archiviste – actuellement le Français Mgr Jean-Louis Bruguès – ces archives exceptionnelles souffrent du poids de leur démesure: rechercher des documents antiques, faire le tri parmi les lettres et ouvrages en tout genre est une tâche hors d’atteinte.

Identifier les traits de plume

Pour faciliter le travail, une équipe scientifique italienne s’est lancée dans la numérisation des documents, avec le projet Codice Ratio. Mais celle-ci est confronté à un défi: les logiciels habituels de reconnaissance des caractères ne savent pas reconnaître les écritures manuscrites des différentes époques.

Ces outils fonctionnent par l’isolement de chaque caractère, avant de le comparer avec une base de données. Si cela fonctionne facilement sur des textes imprimés, la procédure est bien plus compliquée pour des textes manuscrits, où toutes les lettres sont jointes les unes aux autres. Le logiciel ne peut donc plus les segmenter pour les reconnaître une à une.

L’équipe de Codice Ratio a donc eu l’idée d’entraîner leur programme à reconnaître l’épaisseur des traits de plume, les traits les plus fins étant généralement ceux liant les caractères les uns aux autres. Les lettres ont ainsi pu être séparées.

Un jeu d’enfants

L’étape suivante a été de proposer un ‘jeu’ à des élèves italiens : reconnaître parmi différentes lettres mal identifiées les plus proches d’une lettre clairement définie. La capacité humaine à distinguer les lettres a ainsi pu entraîner le programme, afin que celui-ci puisse ensuite le faire automatiquement.

La dernière étape a été de fournir une base de données de mots dans différentes langues – surtout en latin – pour que le logiciel exclut des interprétations de mots inexistants. Par exemple, cette base de données permet au logiciel de proposer ‘anno’ plutôt que ‘aiiiio’.

Malgré ces avancées, la numérisation n’est toutefois pas une solution miracle: certains documents sont d’une grande fragilité tandis que certains sont tout simplement trop mal écrits pour être décryptés par une machine. Dans ce cas, les yeux humains restent en définitive le seul outil pour tenter de lire.

A partir du pontificat d’Innocent III (1198-1216), la papauté a commencé à conserver ses documents les plus importants mais aussi des pièces des premiers siècles. En 1448, Nicolas V les intègre à la Bibliothèque apostolique vaticane, jusqu’en 1612 où elles deviennent une institution à part entière. Et à partir de 1881, ces archives sont progressivement ouvertes aux chercheurs. (cath.ch/imedia/xln/mp)


Le pape Pie XII a été critiqué pour sa soi-disant sympathie germanophile (Photo: True Restoration/Flickr/CC BY-SA 2.0)

Les archives du pontificat du pape Pie XII ouvertes en 2020      

Le big data est devenu un enjeu de société majeure | CC0 domaine public

Le numérique: grand frère ou big brother?  

Actualités ›