Le cancer du poumon et des bronches (LBC) est l’une des causes les plus courantes de décès par cancer dans le monde, représentant 11,6 % de tous les décès par cancer en 2018. En France comme aux Etats-Unis, il est la première cause de mortalité par cancer et si le tabagisme joue un rôle prépondérant dans cette maladie, la pollution et les conditions socio-économiques sont elles aussi facteurs de risque. Une équipe de Université de Buffalo a cherché à comprendre pourquoi ces facteurs n’avaient pas les mêmes conséquences suivant l’endroit où les malades vivent. Ils ont publié les résultats de leur recherche intitulée « Intelligence artificielle explicable pour explorer la variabilité spatiale des taux de mortalité par cancer du poumon et des bronches aux États-Unis contigus » dans la revue Scientific Reports en décembre 2021.
Cette étude qui identifie les principaux facteurs de risque de mortalité LBC à l’aide de l’intelligence artificielle explicable (XAI) a réuni une équipe interdisciplinaire :
- Zia U. Ahmed, PhD, spécialiste des bases de données/visualisation à l’Institut UB RENEW ;
- Kang Sun, PhD, membre du corps professoral principal de l’Institut UB RENEW et professeur adjoint d’ingénierie civile, structurelle et environnementale à l’École d’ingénierie et de sciences appliquées de l’UB ;
- Michael Shelly, PhD, économiste environnemental/écologique à l’Institut UB RENEW ;
- Lina Mu, PhD, MD, professeur agrégé d’épidémiologie et de santé environnementale à l’École de santé publique et des professions de la santé de l’UB.
Zia U. Ahmed déclare au sujet de la recherche :
« Les résultats comptent parce que les États-Unis sont un environnement spatialement hétérogène. Il existe une grande variété de facteurs socioéconomiques et de niveaux d’éducation – essentiellement, une taille ne convient pas à tous. Ici, l’interprétation locale des modèles d’apprentissage automatique est plus importante que l’interprétation globale. »
Lina Mu ajoute :
« L’étude peut être un modèle pour intégrer l’intelligence artificielle dans une étude épidémiologique. Cela peut également servir d’exemple d’utilisation de modèles de prédiction lors de l’étude du cancer. Cela peut grandement aider à identifier les zones à haut risque où le registre du cancer n’est pas disponible. »
L’étude
L’équipe de l’UB a appliqué l’intelligence artificielle explicable (XAI) sur un cadre de modèle d’apprentissage machine à ensemble de piles pour explorer et visualiser la distribution spatiale des contributions des facteurs de risque connus aux taux de mortalité par cancer du poumon et des bronches aux États-Unis contigus. Pour développer des modèles d’ensemble de piles, elle a utilisé le modèle linéaire généralisé (GLM), la forêt aléatoire (RF), la machine d’amplification de gradient (GBM), la machine d’amplification de gradient extrême (XGBoost).
Zia U. Ahmed explique :
« XAI dans l’interprétation locale fait encore défaut, en particulier en ce qui concerne l’environnement et la science. »
Les facteurs de risque explorés par l’étude représentaient des variables liées aux modes de vie dont le tabagisme, au statut socio-économique (taux de pauvreté), à la démographie, à la pollution de l’air, l’environnement physique, les facteurs biophysiques ainsi que l’assurance maladie.
L’étude note que les taux de tabagisme étaient liés aux niveaux de pauvreté et à la race/ethnicité, les hispaniques, par exemple, fument moins que les blancs. Elle montre également une forte relation entre la pauvreté et donc, le manque d’accès aux soins, avec les taux de mortalité LBC aux Etats-Unis.
En ce qui concerne la pollution de l’air, les chercheurs ont examiné les polluants dioxyde d’azote (NO2), dioxyde de soufre (SO2), ozone et particules et leur variabilité spatiale par rapport aux taux de mortalité par cancer du poumon et des bronche
Le tabagisme et la pauvreté se sont révélés les deux facteurs de risques principaux du cancer des poumons et des bronches. Si ces résultats étaient attendus, cette étude démontre un fort potentiel pour la mise en œuvre de l’intelligence artificielle explicable en complément ou en remplacement des modèles de régression spatiale traditionnels.
Sources de l’article : Ahmed, ZU, Sun, K., Shelly, M. et al. Intelligence artificielle explicable (XAI) pour explorer la variabilité spatiale des taux de mortalité par cancer du poumon et des bronches (LBC) aux États-Unis contigus. Sci Rep 11, 24090 (2021). https://doi.org/10.1038/s41598-021-03198-8