Les recherches sur la Nouvelle-France sont à un tournant grâce à l’intelligence artificielle. La mise en commun d’un important corpus d’archives et le développement d’une technologie facilitant l’utilisation de métadonnées sont en train de bouleverser la façon d’étudier cette période charnière de l’histoire du Québec. Regard sur un projet novateur de gestion de données numériques.

Intitulé Nouvelle-France numérique, le projet est une première dans la francophonie. « Le projet initial remonte à 2015. Avec la professeure en lettres Catherine Broué, je m’intéressais au discours autochtone dans les archives de l’Ancien Régime. L’idée était de voir comment les régimes coloniaux s’appropriaient la parole autochtone à travers l’écrit administratif entre la colonie et la métropole. Pour ce faire, nous voulions étudier diverses sources historiques afin de les comparer pour vérifier les variations textuelles témoignant des circonstances dans lesquelles les documents ont été écrits, et ce, au détriment des Autochtones », explique le professeur d’histoire Maxime Gohier.

Or, le développement du logiciel de reconnaissance des écritures manuscrites Transkribus a complètement changé le projet initial. Selon les graphies, cette technologie d’intelligence artificielle développée par le consortium européen READ atteint facilement des taux d’efficacité de plus de 90 %. L’Université du Québec à Rimouski est devenue membre en 2019 de la coopérative READ-Coop qui soutient Transkribus. « Nous avons été dans les premiers groupes de recherche à utiliser cette technologie qui effectue automatiquement la transcription des manuscrits numérisés. Comme elle permet de réaliser de la recherche en archives à une échelle sans précédent, nous avons revu le projet dans son ensemble et nous nous sommes associés à d’autres spécialistes de la Nouvelle-France », mentionne le professeur Gohier.

Le professeur d’histoire Léon Robichaud, de l’Université de Sherbrooke, et Jean-François Palomino, coordonnateur des volets recherche et diffusion des collections patrimoniales à Bibliothèque et Archives nationales du Québec (BAnQ), se sont joints à la professeure Broué et au professeur Gohier pour former le comité de direction du projet. En tout, ce sont près d’une centaine de personnes au Québec et en France qui collaborent, de près ou de loin, au projet de gestion de données de recherche. Le Conseil de la recherche en sciences humaines (CRSH) a en outre appuyé financièrement Nouvelle-France numérique dans le cadre du programme « Développement de partenariats ».

Une approche collaborative

Nouvelle-France numérique est un projet qui repose sur une approche collaborative. Plusieurs organisations ont accepté d’y contribuer en rendant accessibles leurs fonds couvrant les années d’existence de la Nouvelle-France, de la fondation de Québec en 1608 au traité de Paris en 1763. Il s’agit du Musée de la civilisation de Québec, de Bibliothèque et Archives nationales du Québec, de Bibliothèque et Archives Canada, de la Bibliothèque et de la Direction des Archives de l’Université de Montréal, ainsi que des Archives nationales d’Outre-Mer (Aix-en-Provence). Plus de 60 000 pages de manuscrits ont été transcrites jusqu’à maintenant et 60 000 autres le seront d’ici la fin de l’année. « Comme les archives sur la Nouvelle-France sont closes, il n’y en aura pas de nouvelles qui vont apparaître dans l’avenir. Donc, il est possible de transcrire toutes les archives de cette période. C’est titanesque, mais c’est possible », souligne le professeur Gohier.

Le projet Nouvelle-France numérique réunit plusieurs chercheuses et chercheurs en histoire.Le projet Nouvelle-France numérique réunit plusieurs chercheuses et chercheurs en histoire.Le logiciel Transkribus offre le grand avantage de permettre l’ajout de métadonnées aux textes transcrits, poursuit le spécialiste de la Nouvelle-France. « Les chercheuses et les chercheurs impliqués dans Nouvelle-France numérique mettent leurs données en commun afin de faire avancer les connaissances. Le logiciel développé par READ est aussi doté d’un outil de recherche numérique permettant de cibler des mots, des thèmes et éventuellement des graphies. C’est très novateur dans le secteur des humanités numériques. »

La formation d’une relève figure parmi les priorités du comité de direction de Nouvelle-France numérique. Une première université d’été en culture numérique et en gestion de données de recherche a été offerte à l’UQAR sur le thème de la Nouvelle-France maritime. Une quinzaine d’étudiantes et d’étudiants ont pu acquérir de nouvelles connaissances sur la constitution d’un corpus numérique, la paléographie et la transcription, le logiciel Transkribus et le balisage de métadonnées. Un atelier sur les enjeux de la production, du traitement et de la gestion des données numériques a également été présenté à 70 personnes, dont certaines en Europe.

Dépôt numérique

L’équipe de Nouvelle-France numérique poursuit ses travaux d’analyse de corpus et de balisage des métadonnées des documents d’archives numérisés. Le grand public est même invité à contribuer à la transcription de documents en devenant « gardenotes ». « Notre objectif premier, c’est de développer un modèle de partenariat viable à long terme entre les centres d’archives, les bibliothèques, la recherche universitaire et la science citoyenne. Il faut s’assurer que les données produites sur la documentation historique soient pérennes et puissent être mises en relation ensemble afin que toutes les métadonnées soient accessibles aux autres membres en continu. C’est un travail de longue haleine », précise le professeur Gohier.

Afin de rendre accessible la somme des documents étudiés, le comité de direction de Nouvelle-France numérique souhaite créer un dépôt numérique en ligne. « Nous voulons que les connaissances développées soient accessibles au grand public. De plus, nous souhaitons éventuellement développer des partenariats avec d’autres centres d’archives afin d’intégrer leurs documents dans le projet. Comme la technologie ne cesse de se développer, nous nous préoccupons toujours de l’avenir de la recherche afin de conserver le plus d’informations en vue des développements futurs en intelligence artificielle. C’est un des défis importants de la gestion de données de recherche », conclut le professeur Gohier