Nvidia génère de fausses images d’IRM pour rendre plus performante l’analyse de tumeurs du cerveau

Nvidia génère de fausses images d’IRM pour rendre plus performante l’analyse de tumeurs du cerve
Actu IA

Des chercheurs de Nvidia, de la Mayo Clinic et du MGH & BWH Center for Clinical Data Science ont dévoilé leurs travaux sur des réseaux antagonistes génératifs (GANs) utilisés pour créer des images IRM cérébrales. Il s’agit d’une première dans le domaine et leur modèle basé sur le deep learning est capable de générer des images précises et fiables.

Comme l’indique Nvidia dans son article sur le sujet, l’intelligence artificielle révolutionne l’interprétation des images médicales, permettant aux professionnels de la santé de gagner du temps pour l’analyse d’IRM, la tomodensitométrie et les rayons X. Cependant, l’un des défis majeurs des chercheurs en deep learning travaillant dans le milieu médical est le manque de données précises et fiables pour former leurs réseaux neuronaux.

Pour la première fois, les chercheurs utilisent désormais les GAN pour générer des IRM cérébrales anormales pouvant être utilisées pour former des réseaux neuronaux. Une équipe de chercheurs de NVIDIA, de la Mayo Clinic et du MGH & BWH Center for Clinical Data Science a en effet développé un modèle basé sur le deep learning afin de générer des images de synthèse précises et fiables pouvant être utilisées pour former un système d’intelligence artificielle.

“La diversité des données est essentielle à la réussite lors de la formation de modèles de deep learning”, ont déclaré les chercheurs dans leur article intitulé “Medical Image Synthesis for Data Augmentation and Anonymization using Generative Adversarial Networks” disponible sur Arxiv.

“Les ensembles de données d’imagerie médicale sont souvent déséquilibrés, car les résultats pathologiques sont généralement rares, ce qui pose des problèmes importants lors de la formation de modèles de deep learning. Nous proposons une méthode pour générer des images IRM anormales de synthèse avec des tumeurs cérébrales en entraînant un réseau antagoniste génératif”.

En utilisant un système NVIDIA DGX, qui contient des GPU NVIDIA Tesla V100, avec le framework deep learning PyTorch cuDNN-accelerated, l’équipe a formé son GAN sur des données provenant de deux ensembles de données d’IRM cérébrales accessibles au grand public. L’un des ensembles de données contient des milliers d’IRM cérébrales en 3D pondérées en T1 avec la maladie d’Alzheimer, l’autre contient environ deux cents IRM cérébrales 4D avec tumeurs cérébrales.

L’équipe a basé sa méthode de traduction image par image sur le modèle pix2pix, précédemment développé par des chercheurs de NVIDIA.

Les GAN ont déjà été utilisés en imagerie médicale pour générer par exemple un modèle de mouvement à partir d’une seule IRM préopératoire, rééchantillonner une image basse résolution, créer une tomodensitométrie de synthèse à partir d’une IRM cérébrale, effectuer une segmentation médicale et aligner automatiquement différents types d’IRM.

“Cela offre une source automatisable et peu coûteuse de données diverses qui peuvent être utilisées pour compléter l’ensemble de formation”, ont déclaré les chercheurs. “Par exemple, nous pouvons modifier la taille d’une tumeur, changer son emplacement ou placer une tumeur dans un cerveau par ailleurs sain, pour avoir systématiquement l’image et l’annotation correspondante”, explique l’équipe.

Étant donné que les images sont générées par synthèse, il n’y a pas de données sur le patient ou de problèmes de confidentialité. Les institutions médicales peuvent facilement partager les données qu’elles génèrent avec d’autres institutions, créant ainsi des millions de combinaisons différentes pouvant être utilisées pour accélérer le travail et faire gagner du temps aux médecins.

La création de données factices est une pratique de plus en plus courante permettant de pallier à l’une des plus grandes contraintes du deep learning : le besoin d’avoir une grande quantité de données exploitables lors de la phase d’apprentissage.

L’équipe espère que le modèle pourra immédiatement aider les chercheurs en deep learning à générer de nouvelles données pouvant être utilisées pour détecter des anomalies et, finalement, sauver des vies.

Les chercheurs ont publié leur article sur ArXiv et ont également rendu le code disponible sur GitHub.