Intelligence artificielle Les archives nationales américaines utiliseront l'intelligence artificielle pour gérer leurs documents numériques

Pour approfondir le sujet

Sur le même thème :

Irlande : Comment le gouvernement utilise l’intelligence artificielle pour faciliter des tâches administratives

Le ministère irlandais de l'Agriculture, de l'Alimentation et de la Marine (DAFM) est l'organisme chargé de développer et de réglementer le secteur agroalimentaire en...

Automatisation robotisée des processus et machine learning : le pari des hôtels pour relancer le tourisme

UiPath, une entreprise spécialisée dans l'automatisation robotisée de processus, a exploité sa technologie pour développer plusieurs processus d'automatisation au service de l'industrie du tourisme....

DELPHI : un framework du MIT utilisant le machine learning pour estimer l’impact d’un article scientifique

Deux chercheurs du Massachussets Institue of Technology (MIT) ont développé un framework grâce à l'intelligence artificielle. Basée sur le machine learning, cette infrastructure logicielle...

Comment la mairie de Barcelone souhaite favoriser une utilisation éthique de l’intelligence artificielle

La mairie de Barcelone souhaite mettre en œuvre vingt mesures pour garantir que les algorithmes d'intelligence artificielle utilisés par la ville et ceux qui...

Les archives nationales américaines utiliseront l’intelligence artificielle pour gérer leurs documents numériques

L’Administration des archives des Etats-Unis (ou National Archives and Records Administration – NARA) qui détient tous les documents gouvernementaux du pays, gère des millions de fichiers numériques. Afin de faciliter la recherche dans ces précieuses données tout en limitant le marquage manuel des dossiers, l’intelligence artificielle va être utilisée. L’objectif premier sera d’automatiser les processus de gestions de documents pour obtenir ces résultats.

L’intelligence artificielle pour gérer des millions de documents numériques

Le catalogue des archives nationales américaines contient actuellement plus de 120 millions de documents numériques ainsi que des métadonnées d’archives et d’autres types de documents. Paradoxalement à cela, la fonction de recherche permettant de trouver un document spécifique n’est pas du tout sophistiquée tout comme le marquage des métadonnées qui doit se faire manuellement.

De ce constat se sont dégagés trois questionnements clés : Comment la NARA peut-elle faciliter sa recherche de documents ? Comment peut-elle rendre les enregistrements de métadonnées plus efficaces et rapides ? Comment la NARA pourrait garantir l’intégrité de ses données ?

A l’aide d’une requête d’information (RFI), la NARA a pu obtenir des informations concrètes sur de nombreux points : sur l’identification et la résolution des problèmes liées aux données, sur la création de solutions d’IA pour la création de fonctions de recherche et de balisages de métadonnées, sur les potentiels coûts de licence qu’engendrerait la création de ces solutions ou encore sur le stockage des documents numériques.

Le marquage des métadonnées et la fonction de recherche

L’administration des archives américaines a donc organisé une journée où elle a explicité ses objectifs afin d’intégrer l’IA et le machine learning dans deux de ses projets : la personnalisation de la fonction de recherche dans le catalogue et l’automatisation du marquage des métadonnées.

Cette journée consistait à décrire aussi toutes les difficultés qu’il pourrait exister quant à la mise en place de ces deux projets. Parmi les faits retenus : la présence de résultats provenant de la même source rendant difficile la recherche de documents pluri-sources, l’absence de résultats précis si le mot-clé utilisé n’est pas celui précisément utilisé dans le document ou encore l’enregistrement de mots-clés homonymes, l’exemple évoqué est celui du président Truman et du porte-avions Truman.

La NARA souhaite également automatiser le processus de marquage des métadonnées pour éviter de compter sur les employés et les possibles erreurs humaines du marquage manuel. Les technologies de machine learning sont donc envisagées pour mettre en place cette automatisation. La solution développée identifierait les métadonnées utiles au moment de l’acquisition de celles-ci et appliquerait des balises au fur et à mesure de l’enregistrement des métadonnées.

 
Zacharie Tazrout

Partager l'article

META AI dévoile BlenderBot 3, un projet de recherche sur l’IA conversationnelle

Après avoir présenté BlenderBot en 2020, la mouture BlenderBot 2.0 en 2021, META a dévoilé BlenderBot 3 le 5 août dernier. Comme pour ses...

Reconnaissance faciale : la plateforme « From Numbers to Name » aide à identifier les victimes de l’Holocauste

Le deep learning est aujourd'hui utilisé dans de nombreux domaines, il l'est de plus en plus dans celui de l'histoire. Daniel Patt, un ingénieur...

Lancement de l’appel à candidatures de la phase V des pôles de compétitivité

Alors que la phase IV (2019-2022) des pôles de compétitivité prendra fin en décembre 2022, Bruno Le Maire, Ministre de l’Economie, des Finances et...

Focus sur SMART, programme de l’IARPA visant à identifier et surveiller les constructions à grande échelle grâce au machine learning

L'IARPA (Intelligence Advanced Research Projects Activity), la branche de recherche de la communauté du renseignement aux Etats-Unis, a lancé le programme SMART (Space-based Machine...
Recevoir une notification en cas d'actualité importante    OK Non merci