Comment les Archives de Belfort entendent rendre accessibles les anciennes délibérations du conseil municipal grâce à l’IA

Les archives de la ville de Belfort ont lancé en collaboration avec Teklia, fournisseur de solutions pour le traitement sémantique de documents numérisés, un projet pilote consistant en la transcription automatique de 18 500 pages de procès-verbaux divers, rédigés entre 1790 et 1946, lors des délibérations du conseil municipal. Le service des archives invite d’ailleurs des volontaires à participer à la retranscription manuscrite de ces documents afin que le logiciel s’entraîne sur des données de qualité.

Les archives de Belfort veulent rendre accessibles les anciennes délibérations du conseil municipal datant de 1790 à 1946. Si pour être certain de les conserver, le service les a toutes numérisées, il est aujourd’hui impossible de trouver une information sans passer tous les documents en revue.

Les délibérations du conseil municipal sont une source importante pour l’histoire de la ville. Ces documents sont constitués des textes des procès-verbaux des délibérations du conseil municipal, mais aussi des listes de conseillers, des convocations et des ordres du jour, établis il y a plus de 150 ans.

Teklia, une société de logiciels d’IA

Fondée en 2015, dirigée par Christophe Kermorvant, Teklia développe des solutions de traitement de documents pour faciliter les processus d’affaires et aider les entreprises à gagner en productivité. Ses solutions logicielles sont basées sur le ML, le DL et le traitement du langage naturel (NLP). Son principal domaine d’expertise est la reconnaissance automatique de documents manuscrits et imprimés quels que soient le format, la langue ou l’époque.

La société a notamment développé Callico, une plateforme collaborative de transcription automatique et de reconnaissance de documents capable de traiter de grands volumes de documents et de données pour la reconnaissance de texte et d’image, sur laquelle un annotateur non-expert peut se concentrer sur des tâches simples et à un rythme plus rapide.

Un projet collaboratif et innovant unique en France

Dans le cadre de ce projet, Teklia déploie ses technologies HTR (Handwritten Text Recognition) et OCR (Optical Character Recognition). Les modèles HTR et OCR sont deux modèles de reconnaissance conçus respectivement pour les documents manuscrits et imprimés. Selon la société, pour travailler correctement sur des documents historiques manuscrits, ils doivent être formés sur les transcriptions obtenues en annotant manuellement un échantillon de différentes pages de documents. Cette formation permet ensuite au modèle de traiter de nouvelles pages, de détecter des lignes de texte et d’effectuer une transcription automatique.

Exemple de détection de ligne sur l’une des pages numérisées et reconnaissance de l’écriture manuscrite

Pour que le processus de reconnaissance de l’écriture manuscrite soit plus efficace, il est essentiel de former les modèles HTR sur des données de bonne qualité. Cependant, les anciennes délibérations ont été rédigées par différents rédacteurs, leurs écritures sont parfois très difficiles à déchiffrer.

Les archives ont décidé d’impliquer des citoyens dans ce projet qui leur permettra de découvrir le fonctionnement d’un conseil municipal, ainsi que l’évolution de la Ville de Belfort à travers les siècles.

La collecte de données pour ce projet se fera via la plateforme participative Callico. Les contributeurs bénévoles, après s’être inscrits, recevront un lot de 50 pages à retranscrire manuellement, ligne par ligne. Ils peuvent corriger les fautes, ajouter de la ponctuation voire développer les abréviations, passer des pages… le tout à leur rythme.

La ville de Belfort estime que cette tâche prendra de un à deux mois selon le nombre de volontaires. L’ensemble des registres des délibérations du conseil seront alors disponibles pour une recherche plein texte.

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.

1ère Marketplace de l'IA et de la transformation numérique vous recommande :

Automatic document understanding with AI

TEKLIA est une société française éditrice de logiciel qui développe des solutions pour la compréhension automatique de documents numérisés. Ces solut

Découvrir TEKLIA

 
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.