PhySO, quand l’IA retrouve des lois physiques à partir de données scientifiques

Une équipe internationale de chercheurs, incluant des scientifiques du CNRS-INSU et de l’agence scientifique nationale australienne, CSIRO, a développé un algorithme d’IA appelé “PhySO” (Optimisation Symbolique Physique) pour résoudre le défi de créer des modèles physiques analytiques à partir de données scientifiques. Contrairement aux méthodes d’apprentissage profond critiquées pour leur opacité, PhySO génère des équations compréhensibles en manipulant des symboles mathématiques grâce aux progrès dans le traitement du langage et aux techniques de calcul symbolique.

La régression symbolique est l’étude d’algorithmes qui automatisent la recherche d’expressions analytiques qui correspondent à des données. Dans l’article de recherche “Deep Symbolic Regression ,for Physics Guided by Units Constraints: Toward the Automated Discovery of Physical Laws”, les chercheurs abordent la complexité de combiner divers symboles mathématiques de manière significative tout en respectant les règles d’analyse dimensionnelle. Ces règles jouent un rôle crucial en limitant les combinaisons valides lors de la modélisation d’équations physiques.

Ils y présentent PhySO, un framework d’optimisation symbolique physique pour la régression symbolique (RS), qui vise à automatiser la recherche d’expressions analytiques correspondant à des données physiques. Contrairement aux approches récentes d’apprentissage profond, ce nouvel algorithme SR, construit à partir de zéro, est spécifiquement conçu pour la physique, intégrant des contraintes d’unités associées aux données. Il utilise des techniques d’apprentissage par renforcement profond pour récupérer des expressions symboliques analytiques, en garantissant la cohérence des unités physiques et respectant les règles grammaticales de l’analyse dimensionnelle. Il peut ajuster des données sans bruit, dériver des propriétés analytiques d’un modèle physique, et obtenir des approximations analytiques de données bruitées.

Ce cadre a été conçu dès le départ pour incorporer et tirer pleinement parti des informations sur les unités physiques pendant la RS en stockant et en gérant les informations liées à l’analyse dimensionnelle. PhySO inclut les contraintes unitaires in situ pendant le processus de génération d’équations, de sorte que seules les équations à unités équilibrées sont proposées par construction, réduisant ainsi considérablement l’espace de recherche comme illustré dans la figure ci-dessous.

Les chemins vers des expressions avec des unités physiquement plausibles sont représentés en rouge, tandis qu’un échantillon de chemins conduisant à des expressions avec des unités non physiques est indiqué en noir. Les autres chemins non physiques ont été expurgés pour une meilleure lisibilité, représentés par des lignes pointillées avec leur nombre total. L’exemple porte sur la récupération de la vitesse (v) à l’aide d’une bibliothèque de symboles, où v0 est une vitesse, x est une longueur, et t est un temps (limité ici à cinq expressions de longueur de symbole pour plus de clarté). Cette démarche réduit l’espace de recherche initial de 268 expressions à seulement six, soulignant l’efficacité de PhySO dans la restriction de l’espace de recherche tout en maintenant la cohérence avec les unités physiques.

L’algorithme a été testé sur des équations standard de physique, où il a démontré des performances robustes même en présence de bruit important. Il produit des milliers d’équations par seconde, apprenant de manière autonome et améliorant la qualité des équations par essais et erreurs, tout en capitalisant sur ces règles dimensionnelles.

Dans la vidéo ci-dessous, on peut le voir retrouver l’équation du cas d’école de l’oscillateur harmonique à partir d’un jeu de données.

Références de l’article : “Deep Symbolic Regression ,for Physics Guided by Units Constraints: Toward the Automated Discovery of Physical Laws”, The Astrophysical Journal, DOI 10.3847/1538-4357/ad014c

Auteurs : Wassim Tenachi , Rodrigo Ibata , Université de Strasbourg, CNRS, Observatoire astronomique de Strasbourg, UMR 75 et Foivos I. Diakogiannis, CSIRO, Wembley, Australie.

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.
Partager l'article
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.