Peut-on prédire la maladie d'Alzheimer avec GPT-3 et l'analyse du langage?

La maladie d’Alzheimer (MA) est incurable, cependant, la diagnostiquer précocement pourrait améliorer considérablement la prise en charge des patients, leur qualité de vie et celle de leurs aidants… Des chercheurs de l’université Drexel ont démontré que l’intégration de texte basée sur GPT-3 est non seulement une approche viable pour l’évaluation de la MA directement à partir de la parole mais qu’elle a également le potentiel d’améliorer le diagnostic précoce de la démence.

Les progrès de la médecine et de meilleures conditions de vie ont entraîné le vieillissement de la population. Parallèlement, le nombre de personnes atteintes de maladies neurodégénératives ne cesse d’augmenter.

Touchant plus de 55 millions de personnes dans le monde et pour 2/3 des femmes, la maladie d’Alzheimer est l’une des maladies neurodégénératives les plus fréquentes. En France, le nombre de nouveaux cas approcherait les 225.000 chaque année, la plupart chez des personnes de plus de 65 ans.

La progression de la maladie provoque une diminution des fonctions cognitives notamment la mémoire, le raisonnement, la perception (difficulté à reconnaître des visages, des goûts des sons, etc.). Elle peut également entraîner une désorientation dans le temps et dans l’espace et très souvent des troubles de la parole et du langage.

Les grands modèles de langage (LLM) pour détecter précocement la malade d’AlZheimer

Cette déficience du langage étant un symptôme chez 60 à 80% des patients atteints de démence, les recherches précédentes se sont concentrées sur des programmes qui peuvent détecter des indices subtils (hésitation, erreurs de grammaire et de prononciation, l’oubli du sens des mots). Si ces indices étaient présents, le patient subissait un examen approfondi.

Felix Agbavor et Hualou Liang, de l’École de génie biomédical, des sciences et des systèmes de santé de l’Université Drexel, située à Philadelphie, ont choisi une approche différente.

Hualou Liang, co-auteur de l’étude publiée dans la revue PLOS Digital Health, déclare :

“Nous savons par les recherches en cours que les effets cognitifs de la maladie d’Alzheimer peuvent se manifester dans la production du langage. Les tests les plus couramment utilisés pour la détection précoce de la maladie d’Alzheimer examinent les caractéristiques acoustiques, telles que la pause, l’articulation et la qualité vocale, en plus des tests de cognition. Mais nous croyons que l’amélioration des programmes de traitement du langage naturel fournit une autre voie pour soutenir l’identification précoce de la maladie d’Alzheimer”.

Les deux chercheurs ont donc choisi d’utiliser GPT-3 à cette fin. Ce modèle de langage entraîné sur plus de 175 milliards de paramètres par Open AI, se révèle très efficace pour “l’apprentissage sans tir” (apprentissage sans données), où le modèle linguistique est adapté aux tâches en aval, telles que la traduction, le résumé de texte, les réponses aux questions et les systèmes de dialogue, sans avoir besoin de données supplémentaires spécifiques à la tâche.

Pourquoi utiliser l’approche systémique de GPT3 ?

Felix Agbavor, auteur principal de l’étude, déclare :

“L’approche systémique de GPT3 pour l’analyse et la production du langage en fait un candidat prometteur pour identifier les caractéristiques subtiles de la parole qui peuvent prédire l’apparition de la démence. Entraîner GPT-3 avec un ensemble massif d’entretiens – dont certains sont avec des patients atteints de la maladie d’Alzheimer – lui fournirait les informations dont il a besoin pour extraire des modèles de discours qui pourraient ensuite être appliqués pour identifier des marqueurs chez les futurs patients”.

Pour savoir dans quelle mesure les intégrations de texte générées par GPT-3 pouvaient être utilisées pour prédire la démence, ils ont utilisé les données de l’ADReSSo (Alzheimer’s Dementia Recognition through Spontaneous Speech only) Challenge, un ensemble de données d’enregistrements vocaux, compilées avec le soutien des National Institutes of Health, pour la comparaison systématique des approches de détection des troubles cognitifs et du déclin basés sur la parole spontanée.

Le programme a capturé des caractéristiques significatives de l’utilisation des mots, de la structure des phrases et du sens du texte pour produire une intégration, c’est à dire un profil caractéristique du discours sur la maladie d’Alzheimer.

Ils ont ensuite réentraîné le programme avec l’intégration. Pour le tester, ils ont demandé au programme d’examiner des dizaines de transcriptions de l’ensemble de données et de décider si chacune d’entre elles avait été produite par une personne qui développait la maladie d’Alzheimer ou non.

Les chercheurs ont ensuite exécuté deux des meilleurs programmes de traitement du langage naturel à la même vitesse, ils ont alors pu constater que GPT-3 fonctionnait mieux que ceux-ci, que ce soit pour l’identification précise des exemples d’Alzheimer ou l’identification d’exemples non Alzheimer.

Prédiction du score MMSE

Le MMSE (Mini-Mental State Exam) est une mesure couramment employée pour évaluer la gravité de la MA. Les chercheurs ont effectué une analyse de régression en utilisant à la fois les caractéristiques acoustiques et les intégrations de texte de GPT-3 (Ada et Babbage) pour prédire le score MMSE. (Ce score varie de 0 à 30, les scores de 26 ou plus étant considérés comme normaux. Un score de 20 à 24 suggère une démence légère, 13 à 20 suggère une démence modérée et moins de 12 indique une démence sévère).

Les chercheurs ont utilisé trois types de modèles de régression notamment la régression à vecteur de support (SVR), la régression de crête (Ridge) et la régression de forêt aléatoire (RFR).

Ils ont ensuite comparé la précision de la prédiction de GPT-3 à celle d’une analyse utilisant uniquement les caractéristiques acoustiques des enregistrements, telles que les pauses, la force de la voix et les slurring, pour prédire le score MMSE. GPT-3 s’est avéré presque 20% plus précis dans la prédiction des scores MMSE des patients.

Les limitations du modèle

Les auteurs de l’étude ont développé les modèles et effectué la validation interne en se basant principalement sur les données du Défi ADReSSo, ils soulignent qu’une validation externe indépendante supplémentaire est nécessaire pour confirmer leurs constatations.

Pour eux, les principaux défis dans le développement de modèles d’IA pour le diagnostic de la MA, résident dans la qualité des données (incohérence et instabilité), la quantité de données (données limitées) et la diversité.

D’autre part, il est indispensable d’éviter les biais dans l’élaboration du modèle, et donc disposer de données vocales du monde entier, dans de nombreuses langues différentes, et de plus, s’assurer que les modèles fonctionnent équitablement pour tous les patients, quels que soient leur âge, leur sexe, leur origine ethnique, leur nationalité et d’autres critères démographiques. Il est préférable de développer des systèmes éthiques et juridiques pour la mise en œuvre, la validation et le contrôle de l’IA dans les soins cliniques.

Par ailleurs, la protection de la vie privée est une préoccupation majeure dans ce domaine naissant, les données vocales pourraient être utilisées pour identifier les individus.

Les conclusions de l’étude

Pour Félix Agbavor et Hualou Liang :

“Nos résultats démontrent que l’intégration de texte, générée par GPT-3, peut être utilisée de manière fiable non seulement pour détecter les personnes atteintes de la maladie d’Alzheimer à partir de témoins sains, mais aussi pour déduire le score des tests cognitifs du sujet, tous deux basés uniquement sur les données vocales. Nous montrons en outre que l’intégration de texte surpasse l’approche conventionnelle basée sur les caractéristiques acoustiques et fonctionne même de manière compétitive avec des modèles affinés. Ces résultats, tous ensemble, suggèrent que l’intégration de texte basée sur GPT-3 est une approche prometteuse pour l’évaluation de la MA et a le potentiel d’améliorer le diagnostic précoce de la démence”.

Ils pensent que leur modèle d’IA pourrait être déployé sous la forme d’une application Web ou même d’une application vocale utilisée au cabinet du médecin pour aider les cliniciens dans le dépistage de la MA et le diagnostic précoce.

Sources et référence :

https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000168

Agbavor F, Liang H (2022) Prédire la démence à partir de la parole spontanée à l’aide de grands modèles de langage. PLOS Digit Health 1(12): e0000168. https://doi.org/10.1371/journal.pdig.0000168

https://drexel.edu/news/archive/2022/December/GPT-3-alzheimers-dis

Cette perte neuronale aboutissant en fin de compte à une perte d’autonomie. Un fait important à noter est que 2 personnes sur 3 touchées par la maladie d’Alzheimer sont des femmes.