Une équipe française du projet MINERVA remporte le SKAO Data Challenge 2021 en utilisant le supercalculateur Jean Zay

MINERVA Jean Zay SKAO SDC2

L’observatoire en radioastronomie du projet SKA est annoncé comme l’une des plus grandes machines sur terre. Il s’étendra sur un kilomètre carré comme son nom le laisse présumer : Square Kilometer Array. SKAO, l’observatoire de SKA, fournira aux scientifiques des données d’une qualité inégalée, en grande quantité et d’une grande diversité. Cette année était organisée la seconde édition du Data Challenge de SKAO (SDC2), auquel ont participé des scientifiques du monde entier et c’est l’équipe MINERVA de l’Observatoire de Paris/PSL avec le CNRS, l’Observatoire de la Côte d’Azur, l’Observatoire astronomique de Strasbourg, le partenariat de l’Institut canadien d’astrophysique théorique qui a remporté le challenge grâce à un algorithme innovant ayant bénéficié des compétences du supercalculateur Jean Zay GENCI-IDRIS/Centre National de la recherche scientifique.

Les instruments de l’observatoire en radioastronomie SKA (SKAO) ont été conçus de 2012 à 2020 par SKA Organisation, entreprise qui regroupe des membres de 14 pays (dont le CNRS pour la France) et collabore avec une centaine d’organisations de plus de 20 pays. C’est en prévision de l’exploitation scientifique de SKAO que sont organisés les Data Challenge de SKAO (SDCs) afin d’assurer une exploitation maximale des données dès l’entrée en phase d’exploitation initiale des télescopes et dynamiser le développement de techniques d’analyse de données. Les SDCs sont également utiles dans le domaine informatique pour préparer les systèmes et les processus indispensables au réseau de centres régionaux SKA (SRC) qui stockeront, traiteront et fourniront un accès aux données aux astronomes du monde entier.

280 participants, de 22 pays différents

Ce ne sont pas moins de quarante équipes, composées de 280 participants, provenant de 22 pays différents, qui ont participé à cette deuxième édition du SDC2 qui a débuté en février dernier et duré six mois. Ils ont été soutenus par huit grands centres de calcul à travers le monde, fournissant des ressources de stockage et de traitements indispensables au bon déroulement des défis.

Les équipes devaient développer des algorithmes capables d’identifier et de caractériser près de 250 000 galaxies dans un cube de données de taille 1 To, issu d’une observation simulée de SKAO en spectro-imagerie dans la gamme de longueurs d’onde autour de la raie à 21 cm de l’atome d’hydrogène.

Les équipes ont été notées sur deux éléments qui, combinés, ont donné le score final du SDC2. Ces deux éléments ont été le nombre d’objets identifiés (avec une pénalité pour les faux positifs) et la précision avec laquelle les différentes caractéristiques des objets, par exemple leur taille ou leur luminosité, ont été mesurées.

Infographie représentant la participation au Science Data Challenge 2 du SKAO. Au total, 40 équipes comprenant 280 participants de 22 pays ont pris part à ce défi de 6 mois. Elles ont été soutenues par huit installations informatiques pour identifier et caractériser près de 250 000 galaxies dans un cube de données simulé de 1 To. Illustration : SKAO

Une belle réussite pour le projet MINERVA

Le 13 octobre 2021, SKAO a annoncé que le SDC2 a été remporté par une équipe française ayant bénéficié du projet MINERVA financé par l’Observatoire de Paris – PSL et utilisant les ressources du supercalculateur national français Jean Zay de GENCI, l’un des plus puissants supercalculateurs européens opérationnels faisant converger calcul intensif (HPC) et intelligence artificielle, exploité et hébergé par l’Institut du Développement et des Ressources en Informatique Scientifique (IDRIS) du CNRS. L’objectif du projet MINERVA est d’explorer l’utilisation de l’apprentissage automatique dans divers domaines de la radioastronomie, avec une attention particulière sur la préparation de SKAO. Philippe Lavocat, PDG de Genci a déclaré :

« Alors que 1 000 heures de ressources informatiques GPU ont été allouées par l’IDRIS au projet MINERVA pour permettre le développement d’une méthode d’apprentissage automatique afin de mieux répondre aux besoins des images astronomiques, ce succès annonce des développements futurs très prometteurs entre HPC/AI et des instruments scientifiques de grande envergure dans le cadre du projet SKA, conformément au plan stratégique de GENCI. »

L’équipe gagnante était également composée de collaborateurs de l’Université de Toronto et de l’Observatoire Astronomique de Strasbourg. Elle a remporté le SDC2 en développant deux pipelines en parallèle, tous deux s’appuyant sur les réseaux neuronaux convolutifs (CNN).

Le premier est une version améliorée de YOLO, le détecteur d’objets, adapté aux besoins spécifiques des données astronomiques et généralisée en 3D, tandis que le second combine plusieurs réseaux ad hoc mis en œuvre uniquement pour le SDC2. La fusion des catalogues résultant de ces deux NC a donné le score le plus élevé du SDC2.

Le développement de l’algorithme a été réalisé sur des ressources locales à l’Observatoire de Paris – PSL, tandis que le traitement du cube de données de 1 To SDC2 complet a été effectué sur l’ordinateur Jean Zay de l’IDRIS en utilisant jusqu’à 25 GPU simultanément. Antoine Petit, PDG du CNRS se félicite :

« C’est un grand plaisir de voir les interactions entre les astronomes et les informaticiens dans nos laboratoires, encouragées par le projet SKA. Les défis posés par la radioastronomie attirent de plus en plus l’attention de la communauté des informaticiens. Le CNRS, doté de solides capacités interdisciplinaires, est en très bonne position pour apporter les développements importants nécessaires à l’avènement et au succès de SKA.»

SKAO, dont les travaux ont officiellement débuté le 1er juillet 2021, sera un observatoire exploitant deux télescopes composés de grands réseaux d’antennes (plus de 131 000 antennes en Australie, SKA-LOW, et un peu moins de 200 antennes paraboliques d’environ 15 m de diamètre en Afrique du Sud – SKA-MID), capable de capter globalement le rayonnement électromagnétique émis par les objets célestes entre 50 MHz et 15,4 GH.

Image composite nocturne du SKA combinant tous les éléments en Afrique du Sud et en Australie. Photo : SKAO, ICRAR, SARAO

La France dans le projet SKAO

En mai 2021, après une décision unanime du Conseil de SKAO, la France a été le premier pays à rejoindre les sept membres fondateurs (Australie, Chine, Italie, Pays-Bas, Portugal, Afrique du Sud et Royaume-Uni).

Frédérique Vidal, Ministre de l’Enseignement Supérieur, de la Recherche et de l’Innovation avait annoncé le 4 février 2021 l’engagement de la France dans le processus de candidature à SKAO, des travaux ayant été menés par le CNRS dans cet objectif, lors de la première réunion du Conseil SKAO et elle est à présent un acteur indéniable de ce projet. Le DR C. Ferrari, directrice de Ska-France et astronome à L’OCA indique :

« La participation de la France au SDC2 est un bel exemple d’efforts communs que nous visons en coordonnant les activités liées à SKA en France. La collaboration d’astronomes, de développeurs, d’ingénieurs de différents instituts de recherche et d’infrastructures sera primordiale pour la future organisation des centres régionaux SKA, le réseau mondial d’infrastructures informatiques et de données qui permettra aux astronomes d’accéder aux produits scientifiques de l’Observatoire SKA et de les exploiter pleinement. »

Les laboratoires de recherche ayant participé à la victoire de l’équipe française au SDC2 :

  • Laboratoire d’étude du rayonnement et de la matière en astrophysique et atmosphères (Observatoire de Paris – PSL/CNRS/Sorbonne Université/CY Cergy Paris Université),
  • Laboratoire Galaxies, Etoiles, Physique, Instrumentation (Observatoire de Paris – PSL/CNRS)
  • Observatoire astronomique de Strasbourg (CNRS/Université de Strasbourg)
    Institut du Développement et des Ressources en Informatique Scientifique (IDRIS-CNRS)
  • UAR Galilée (Université Côte d’Azur, Observatoire de la Côte d’Azur, CNRS)

1ère Marketplace de l'IA et de la transformation numérique vous recommande :

GENCI est la Très Grande Infrastructure de Recherche qui permet aux chercheurs et industriels d’accéder à des supercalculateurs pour leurs travaux de

Découvrir GENCI

 

Profitez de l'offre Cyber Monday :
1 an d'abonnement électronique pour 15€

Partager l'article
Abonnez-vous à ActuIA, la revue professionnelle de l'intelligence artificielle magazine intelligence artificielle Découvrez la revue professionnelle de l'intelligence artificielle
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.