Le MIAT a créé une protéine hyper-stable grâce à ToulBar2, son logiciel d’intelligence artificielle

ToulBar2

Le laboratoire Mathématiques et Informatique Appliquées de Toulouse (MIAT) a collaboré avec la KU Leuven en Belgique et l’institut Riken au Japon, pour un ambitieux projet de bioinformatique. En utilisant des algorithmes de raisonnement automatique, ils sont parvenus à créer une protéine hyper-stable capable de s’assembler seule.

Le raisonnement automatique est un domaine de l’IA qui vise en particulier à faire résoudre par l’ordinateur des casse-têtes extrêmement complexes, impliquant des milliers ou millions de paramètres inter-dépendants. L’une de ces IA a ainsi récemment prouvé un théorème qui avait résisté aux efforts des mathématiciens depuis des décennies. Grâce à l’IA développée dans le logiciel ToulBar2, résoudre le plus difficile des Sudokus demande seulement quelques millisecondes. Mais il y a des casse-tête, plus difficiles, dont la résolution n’est pas aussi simple.

ToulBar2

ToulBar2 est un logiciel créé par les équipes du laboratoire MIAT du centre Inra Occitanie-Toulouse basé sur des algorithmes de raisonnement automatique, spécialisé dans la résolution de casse-têtes complexes impliquant des éléments qu’il faut sélectionner dans un ensemble fini. Ces problèmes sont difficiles à résoudre y compris pour les ordinateurs (ils sont dits « NP-complets »).

Un exemple célèbre de tels problèmes est le Sudoku. Dans un Sudoku, chaque cellule contient un nombre entre 1 et 9. Et chaque nombre dans une ligne, une colonne ou un bloc de trois par trois doit être différent. À partir de ces règles et d’une grille de Sudoku, Toulbar2 produit instantanément sa solution.

La force de ToulBar2 est qu’il n’est pas restreint à des règles logiques : il peut aussi gérer des règles impliquant des coûts (ex : une règle selon laquelle il est interdit d’avoir deux chiffres dans les cellules adjacentes qui ne diffèrent que d’un, avec une amende associée pour une infraction de 100 unités de coût). Quand de telles règles existent, ToulBar2 produit la solution la moins coûteuse et prouvera également qu’il n’y en a pas de meilleure. Grâce à cette faculté, il peut résoudre des casse-têtes bien plus complexes qu’un Sudoku. ToulBar2 et ses auteurs ont appris et amélioré la conception des protéines grâce à une collaboration de longue date avec l’INSA-LISBP.

Accélérer la conception de nouvelles protéines grâce aux algorithmes de raisonnement automatique

Les protéines sont les principales molécules de la vie. Elles sont à la base du fonctionnement des cellules chez l’homme, les animaux, les plantes, les champignons et les microbes. Elles peuvent se lier à d’autres molécules ou s’assembler pour construire des structures complexes. Elles peuvent surtout catalyser des réactions chimiques à température et pression ambiantes tout en étant biodégradables. En biologie synthétique, les équipes toulousaines tentent d’accélérer la conception de nouvelles protéines. Si les réseaux de neurones artificiels sont à la base de nombreux progrès récents dans le domaine de l’IA, c’est une autre technologie qui a été utilisée ici : les algorithmes de raisonnement automatique.

En collaboration avec des biochimistes de la KU Leuven (Belgique) et de l’institut Riken (Japon), ToulBar2 a été chargé de créer une protéine en sélectionnant et organisant ses atomes de manière à ce que ses copies s’assemblent automatiquement dans l’eau pour former une protéine symétrique de plus grande taille.

En utilisant une structure préliminaire et une représentation approximative de forces intermoléculaires connues comme le champ de force Talaris14 (issue du logiciel Rosetta, Université de Washington), ToulBar2 a résolu un casse-tête qui avait plus de combinaisons que le nombre d’atomes connus dans tout l’univers. Il a néanmoins été capable de trouver une organisation optimale des atomes et de prouver que c’était la meilleure possible pour Talaris14.

Aucun super-calculateur n’est nécessaire, ToulBar2 se contente d’un simple ordinateur de bureau. Les plans de la protéine ainsi conçue (sa séquence d’acides aminés) a ensuite été encodé en ADN et inséré dans une bactérie (E. coli). Celle-ci s’est multipliée et a synthétisé un grand nombre de copies de la protéine. La protéine finale a été cristallisée : sa forme est bien celle attendue. Elle est obtenue par l’assemblage dans l’eau des composants élémentaires conçus par ToulBar2.

Ces nouvelles protéines ont un fort potentiel d’application en médecine, en chimie verte, dans les biocarburants ou pour le recyclage. Avoir la capacité de concevoir de nouvelles protéines sur mesure est donc un enjeu majeur pour la santé et peut potentiellement réduire notre empreinte environnementale.

Références de publications

Noguchi, H., Addy, C., Simoncini, D., Wouters, S., Mylemans, B., Van Meervelt, L., Schiex, T., Zhang, K.Y., Tame, J.R.H. and Voet, A.R.D., 2019.Computational design of symmetrical eight-bladedβ-propeller proteins. IUCrJ, 6(1).

https://journals.iucr.org/m/issues/2019/01/00/jt5028/index.html
https://doi.org/10.1107/S205225251801480X

Allouche, D., André, I., Barbe, S., Davies, J., De Givry, S., Katsirelos, G., O’Sullivan, B., Prestwich, S., Schiex, T. and Traoré, S., 2014. Computational protein design as an optimization problem. Artificial Intelligence, 212, pp.59-79.

https://www.sciencedirect.com/science/article/pii/S0004370214000332
https://doi.org/10.1016/j.artint.2014.03.005

Simoncini, D., Allouche, D., de Givry, S., Delmas, C., Barbe, S. and Schiex, T., 2015. Guaranteed discrete energy optimization on large protein design problems. Journal of chemical theory and computation, 11(12), pp.5980-5989.

https://pubs.acs.org/doi/abs/10.1021/acs.jctc.5b00594
DOI: 10.1021/acs.jctc.5b00594

Recevez gratuitement l'actualité de l'intelligence artificielle

Suivez la Newsletter de référence sur l'intelligence artificielle (+ de 18 000 membres), quotidienne et 100% gratuite.


Tout comme vous, nous n'apprécions pas le spam. Vos coordonnées ne seront transmises à aucun tiers.

1ère Marketplace de l'IA et de la transformation numérique vous recommande :
XLRISK® par Addinsoft

Logiciel de simulation monte carlo qui rend l'analyse quantitative des risques intuitive. xlrisk® est un complément excel® qui permet d'inclure de l'i...

 
Partager l'article
Offre exclusive : 1 an d'abonnement au magazine ActuIA + Le guide pratique d'adoption de l'IA en entreprise pour seulement 27,60€ Boutique ActuIA Pour tout abonnement à ActuIA, recevez en cadeau le Guide Pratique d'Adoption de l'IA en Entreprise, d'une valeur de 23€ !
intelligence artificielle
À PROPOS DE NOUS
Le portail francophone consacré à l'intelligence artificielle et à la datascience, à destination des chercheurs, étudiants, professionnels et passionnés.