Le MIAT a créé une protéine hyper-stable grâce à ToulBar2, son logiciel d’intelligence artificielle

Le MIAT a créé une protéine hyper-stable grâce à ToulBar2, son logiciel d’intelligence artificielle
Actu IA
ToulBar2

Le laboratoire Mathématiques et Informatique Appliquées de Toulouse (MIAT) a collaboré avec la KU Leuven en Belgique et l’institut Riken au Japon, pour un ambitieux projet de bioinformatique. En utilisant des algorithmes de raisonnement automatique, ils sont parvenus à créer une protéine hyper-stable capable de s’assembler seule.

Le raisonnement automatique est un domaine de l’IA qui vise en particulier à faire résoudre par l’ordinateur des casse-têtes extrêmement complexes, impliquant des milliers ou millions de paramètres inter-dépendants. L’une de ces IA a ainsi récemment prouvé un théorème qui avait résisté aux efforts des mathématiciens depuis des décennies. Grâce à l’IA développée dans le logiciel ToulBar2, résoudre le plus difficile des Sudokus demande seulement quelques millisecondes. Mais il y a des casse-tête, plus difficiles, dont la résolution n’est pas aussi simple.

ToulBar2

ToulBar2 est un logiciel créé par les équipes du laboratoire MIAT du centre Inra Occitanie-Toulouse basé sur des algorithmes de raisonnement automatique, spécialisé dans la résolution de casse-têtes complexes impliquant des éléments qu’il faut sélectionner dans un ensemble fini. Ces problèmes sont difficiles à résoudre y compris pour les ordinateurs (ils sont dits « NP-complets »).

Un exemple célèbre de tels problèmes est le Sudoku. Dans un Sudoku, chaque cellule contient un nombre entre 1 et 9. Et chaque nombre dans une ligne, une colonne ou un bloc de trois par trois doit être différent. À partir de ces règles et d’une grille de Sudoku, Toulbar2 produit instantanément sa solution.

La force de ToulBar2 est qu’il n’est pas restreint à des règles logiques : il peut aussi gérer des règles impliquant des coûts (ex : une règle selon laquelle il est interdit d’avoir deux chiffres dans les cellules adjacentes qui ne diffèrent que d’un, avec une amende associée pour une infraction de 100 unités de coût). Quand de telles règles existent, ToulBar2 produit la solution la moins coûteuse et prouvera également qu’il n’y en a pas de meilleure. Grâce à cette faculté, il peut résoudre des casse-têtes bien plus complexes qu’un Sudoku. ToulBar2 et ses auteurs ont appris et amélioré la conception des protéines grâce à une collaboration de longue date avec l’INSA-LISBP.

Accélérer la conception de nouvelles protéines grâce aux algorithmes de raisonnement automatique

Les protéines sont les principales molécules de la vie. Elles sont à la base du fonctionnement des cellules chez l’homme, les animaux, les plantes, les champignons et les microbes. Elles peuvent se lier à d’autres molécules ou s’assembler pour construire des structures complexes. Elles peuvent surtout catalyser des réactions chimiques à température et pression ambiantes tout en étant biodégradables. En biologie synthétique, les équipes toulousaines tentent d’accélérer la conception de nouvelles protéines. Si les réseaux de neurones artificiels sont à la base de nombreux progrès récents dans le domaine de l’IA, c’est une autre technologie qui a été utilisée ici : les algorithmes de raisonnement automatique.

En collaboration avec des biochimistes de la KU Leuven (Belgique) et de l’institut Riken (Japon), ToulBar2 a été chargé de créer une protéine en sélectionnant et organisant ses atomes de manière à ce que ses copies s’assemblent automatiquement dans l’eau pour former une protéine symétrique de plus grande taille.

En utilisant une structure préliminaire et une représentation approximative de forces intermoléculaires connues comme le champ de force Talaris14 (issue du logiciel Rosetta, Université de Washington), ToulBar2 a résolu un casse-tête qui avait plus de combinaisons que le nombre d’atomes connus dans tout l’univers. Il a néanmoins été capable de trouver une organisation optimale des atomes et de prouver que c’était la meilleure possible pour Talaris14.

Aucun super-calculateur n’est nécessaire, ToulBar2 se contente d’un simple ordinateur de bureau. Les plans de la protéine ainsi conçue (sa séquence d’acides aminés) a ensuite été encodé en ADN et inséré dans une bactérie (E. coli). Celle-ci s’est multipliée et a synthétisé un grand nombre de copies de la protéine. La protéine finale a été cristallisée : sa forme est bien celle attendue. Elle est obtenue par l’assemblage dans l’eau des composants élémentaires conçus par ToulBar2.

Ces nouvelles protéines ont un fort potentiel d’application en médecine, en chimie verte, dans les biocarburants ou pour le recyclage. Avoir la capacité de concevoir de nouvelles protéines sur mesure est donc un enjeu majeur pour la santé et peut potentiellement réduire notre empreinte environnementale.

Références de publications

Noguchi, H., Addy, C., Simoncini, D., Wouters, S., Mylemans, B., Van Meervelt, L., Schiex, T., Zhang, K.Y., Tame, J.R.H. and Voet, A.R.D., 2019.Computational design of symmetrical eight-bladedβ-propeller proteins. IUCrJ, 6(1).

https://journals.iucr.org/m/issues/2019/01/00/jt5028/index.html
https://doi.org/10.1107/S205225251801480X

Allouche, D., André, I., Barbe, S., Davies, J., De Givry, S., Katsirelos, G., O’Sullivan, B., Prestwich, S., Schiex, T. and Traoré, S., 2014. Computational protein design as an optimization problem. Artificial Intelligence, 212, pp.59-79.

https://www.sciencedirect.com/science/article/pii/S0004370214000332
https://doi.org/10.1016/j.artint.2014.03.005

Simoncini, D., Allouche, D., de Givry, S., Delmas, C., Barbe, S. and Schiex, T., 2015. Guaranteed discrete energy optimization on large protein design problems. Journal of chemical theory and computation, 11(12), pp.5980-5989.

https://pubs.acs.org/doi/abs/10.1021/acs.jctc.5b00594
DOI: 10.1021/acs.jctc.5b00594