Page d'accueil // C2DH // News & E... // Spresso : les photos de presse historiques passent au supercalculateur

Spresso : les photos de presse historiques passent au supercalculateur

twitter linkedin facebook email this page
Publié le lundi 12 septembre 2022

Alors que les superordinateurs sont traditionnellement utilisés dans les domaines de la physique, de la science des matériaux et de la chimie de pointe, le projet Spresso constitue la toute première coopération formelle entre le superordinateur luxembourgeois MeluXina, la Bibliothèque nationale du Luxembourg et une équipe interdisciplinaire de chercheurs du Centre for Contemporary and Digital History (C²DH) et du Département Informatique de l'Université du Luxembourg, afin d'explorer l'amélioration automatique à grande échelle des photographies de journaux historiques du XXe  siècle au moyen d'algorithmes d'apprentissage profond.

Pendant des années, la photographie de presse a joué un rôle essentiel dans la représentation des pays, des personnes et des événements dans l'esprit des lecteurs de journaux du monde entier. Ces images constituent à cet effet une source inestimable pour les historiens. Les photos de journaux ont été imprimées selon un procédé appelé demi-teinte avec son motif de points caractéristique. Le projet Spresso se concentre sur les copies numériques de ces images en demi-teinte qui ont été fournies par le projet Impresso. Impresso est une coopération entre le C²DH de l'Université du Luxembourg, l'EPFL de Lausanne et l'Université de Zurich ainsi qu'un large éventail d'archives, de bibliothèques et de journaux au Luxembourg et en Suisse. Spresso s'est fixé pour objectif de rendre ce trésor d'images plus accessible et utilisable pour des approches de recherche modernes.

En appliquant un algorithme de super-résolution basé sur des modèles d'apprentissage profond aux images en demi-teinte numérisées, Spresso a créé de nouvelles images synthétiques à partir du matériau source avec un degré de détail souvent surprenant, en éliminant les motifs existants qui réduisaient la qualité de l'image.

Sample 1

À partir d'un ensemble initial de 10 000 images et sous la direction du Prof. Luis Leiva, Dany Pais da Silva, ancien étudiant du Bachelor in Computer Science, a testé différents algorithmes de super résolution et mis en œuvre un prototype de pipeline pour la conversion des images historiques sur les installations de calcul haute performance de l'université. Avec le soutien des ingénieurs de LuxProvide, l'équipe a pu transférer le processus sur le nouveau supercalculateur MeluXina, permettant une mise à l'échelle pour l'appliquer à plus de 3 millions d'images. « Travailler avec MeluXina et les ingénieurs de LuxProvide dans le cadre d'un projet interdisciplinaire a été pour moi une excellente occasion d'améliorer mes compétences en matière de big data », a réagi Dany Pais da Silva. Il est intéressant de noter que le plus difficile a été de télécharger les données, et non la puissance de calcul nécessaire pour les traiter. « Obtenir l'accès aux images brutes a été un défi pour nous, car nous avons dû les transférer de leur source originale à MeluXina, puis les ramener dans les locaux de l'université », explique Prof. Luis Leiva.

Le nouvel ensemble de données sera réinjecté dans l'application Impresso à l'avenir afin de fournir aux historiens et au grand public ces images de meilleure qualité. Les historiens Estelle Bunout et Marten Düring ont déclaré : « L'apprentissage profond offre de grandes possibilités pour l'histoire numérique. Les données synthétiques générées par l'apprentissage profond offrent des possibilités passionnantes de dialogue entre le raisonnement humain et l'analyse informatique. Mais elles soulèvent également de nouvelles questions fondamentales concernant les notions existantes d'authenticité et de fiabilité des archives historiques. Le projet Spresso deviendra pour nous un point de départ pour explorer dans quelle mesure les images modifiées par des algorithmes améliorent l'enrichissement ultérieur, par exemple la détection et l'identification d'objets. »

Lars Wieneke, Head of the Digital Research Infrastructure au C²DH, ajoute : « Grâce au travail de Dany Pais da Silva et du Prof. Leiva ainsi que de l'équipe de LuxProvide, nous pouvons maintenant travailler avec un corpus d'images grandement améliorées que nous allons défier avec des algorithmes de reconnaissance avancés afin de mieux comprendre si la super résolution apporte non seulement une amélioration perçue de la qualité mais également de meilleurs taux de reconnaissance pour une variété de tâches telles que l'identification d'objets ou de personnes. »

Sample 2