Page d'accueil // Université // Actualités // À la une // 1,7 million de francs suisses pour un nouveau projet du C²DH

1,7 million de francs suisses pour un nouveau projet du C²DH

twitter linkedin facebook google+ email this page
Publié le jeudi, 08 juin 2017

Le C²DH obtient un financement de projet pour une exploitation de textes à réflexion méthodologique de journaux historiques.

Le projet intitulé Media Monitoring of the Past. Mining 200 years of historical newspapers vise à relier des corpus journalistiques numérisés suisses, luxembourgeois, français et allemands et à développer de nouvelles méthodes d'évaluation.

Pendant les trois prochaines années, le Luxembourg Centre for Contemporary and Digital History (C²DH), le DHLAB de l’École polytechnique fédérale de Lausanne (EPFL) et l’institut de linguistique informatique de l’Université de Zurich vont collaborer sur ce projet financé par le Fonds national suisse de la recherche scientifique (FNS) à hauteur de 1,7 million de francs suisses. Parmi les partenaires de projet associés on trouve notamment la Bibliothèque nationale de Luxembourg (BnL), la Bibliothèque nationale suisse (BN), les quotidiens suisses Le Temps et la Neue Zürcher Zeitung, des archives suisses ainsi que des chercheurs de l’Université de Lausanne. Côté luxembourgeois, le projet est coordonné par Dr. Marten Düring, Dr. Lars Wieneke et Prof. Dr. Andreas Fickers en collaboration avec Daniele Guido and Estelle Bunout.

Les journaux historiques comptent parmi les sources historiques les plus riches et ils existent pour la plupart déjà sous forme numérique. Néanmoins, un certain nombre de problèmes se posent dans le travail scientifique avec ces sources. Parmi ceux-ci, citons des résultats de recherche incomplets causés par une reconnaissance de texte défaillante et des métadonnées manquantes, l’isolement relatif des journaux numérisés dans les archives respectives, des fonctions de recherche difficilement compréhensibles et des interfaces utilisateurs inadaptées. Par ailleurs, les progrès dans l’analyse de texte offrent de nouvelles possibilités dans la recherche sur de vastes collections de textes.
Le projet permettra de développer de nouvelles méthodes de deep learning (apprentissage en profondeur) pour la correction d’erreurs dans la reconnaissance de texte, de travailler à une meilleure identification de noms de personnes, d’institutions et de lieux ainsi qu’à l’enrichissement de ces noms propres à l’aide de référentiels de données externes. Le C²DH sera responsable pour le développement d’une interface utilisateur permettant d’intégrer de nouvelles fonctions de recherche et de faciliter l’examen critique du corpus de journaux. Il s’agit par exemple d'informations sur l’origine des données, sur la qualité des annotations générées automatiquement, mais aussi d’indications sur des lacunes à l'intérieur de l'inventaire.

Afin de garantir une haute pertinence du projet pour les sciences historiques, humaines et sociales en général, le C²DH coordonnera un certain nombre d’ateliers, qui permettront un échange direct entre les utilisateurs et les développeurs. Un autre projet de recherche du C²DH traitera des mouvements de résistance contre l'idée d’une unification européenne à la fin du XIXᵉ et au début du XXᵉ siècle et créera ainsi une interaction supplémentaire entre les sciences historiques, l’informatique et le design. Finalement, le projet sera également intégré dans l’enseignement universitaire et permettra ainsi à de futurs historiens de s’intéresser aux procédés automatisés d’extraction et de représentation des informations provenant de sources historiques.

À la fin du projet, celui-ci aura donné lieu à des publications scientifiques ainsi qu’à différents systèmes pour le traitement, l’analyse et la sauvegarde de données qui seront disponibles sous forme de code open source pour une utilisation ultérieure et un développement futur.

Le programme Sinergia du Fonds national suisse de la recherche scientifique (FNS) soutient exclusivement des équipes de recherche interdisciplinaires, qui effectuent de la recherche collaborative visant à ouvrir de nouvelles perspectives (recherche pionnière). Pour être éligibles, les requêtes Sinergia doivent prévoir de résoudre les problèmes posés en combinant les théories et les méthodes de plusieurs disciplines à valeurs équivalentes et les partenaires associés doivent mettre à disposition des compétences et des connaissances complémentaires.