Soutenance de thèse de Benjamin Molinet

mercredi 18 décembre 2024

Benjamin Molinet soutiendra sa thèse de doctorat le mercredi 18 décembre 2024 à 14h00 au Centre Inria d'Université Côte d'Azur dans la salle « Euler Violet ».

La thèse intitulée « Génération et évaluation d’explications argumentatives en langage naturel appliquées au domaine médical » a été réalisée dans le pôle Sparks sous la direction de Elena Cabrio et de Serena Villata co-directrice de thèse.

La présentation sera en anglais.

 

Résumé :

L'Argument Mining, un domaine en pleine expansion du traitement automatique du langage naturel (TALN) et des modèles informatiques d'argumentation, vise à reconnaître automatiquement les structures d'argumentation (c'est-à-dire les composants et les relations) dans les ressources textuelles en langage naturel.

Dans le domaine médical, l'Argument Mining s'est avérée bénéfique en fournissant des méthodes pour détecter automatiquement les structures argumentatives afin de soutenir la médecine fondée sur des preuves.

L'importance de ces approches repose sur le fait que, malgré la précision des modèles neuronaux dans la prédiction de diagnostic médical, l'explication de leurs résultats reste problématique.

Cette thèse aborde cette question ouverte et se concentre sur la génération et l'évaluation d'explications argumentatives en langage naturel pour les prédictions de diagnostic médicaux, afin d'aider les cliniciens dans la prise de décision et l'éducation.

Tout d'abord, j'ai proposé un nouveau pipeline complet pour générer automatiquement des explications en langage naturel d’examens (QCM) médicaux sur les diagnostics en s'appuyant sur une ontologie médicale et des entités cliniques détectées à partir des textes d'examen.

J'ai défini un système état de l’art de reconnaissance et de classification des entités nommées médicales (NERC) pour détecter les symptômes exprimés par les patients et les mesures médicales que j'aligne sur les termes de l'ontologie afin de justifier le diagnostic d'un cas clinique fourni aux étudiants en médecine.

Le pipeline, appelé SYMEXP, permet à notre système de générer des explications argumentatives en langage naturel basées sur des templates afin de justifier pourquoi la bonne réponse est correcte et pourquoi les autres options proposées ne le sont pas.

Deuxièmement, j'ai proposé un cadre d'évaluation des explications basées sur l'argumentation, appelé ABEXA, pour extraire automatiquement la structure argumentative d'un QCM médicale et mettre en évidence un ensemble de critères personnalisables pour caractériser l'explication clinique et l'argumentation du document.

ABEXA aborde la question de l'évaluation des explications d'un point de vue argumentatif en définissant un ensemble de patterns sur un graphe argumentatif généré automatiquement.

Troisièmement, j'ai contribué à la conception et au développement de la suite de logiciels ANTIDOTE, qui propose différents modules d'intelligence artificielle explicative guidée par l'argumentation pour la médecine.

Notre système offre les fonctionnalités suivantes : analyse argumentative multilingue pour le domaine médical, explication, extraction et génération de diagnostics cliniques, modèles linguistiques multilingues pour le domaine médical, et le premier benchmark multilingue de QCM médicaux.

En conclusion, dans cette thèse, j'explore comment l'intelligence artificielle combinée à la théorie de l'argumentation pourrait conduire à des systèmes de soins et de santé plus transparents.

Nous appliquons nos résultats au domaine critique de la médecine en montrant tout leur potentiel en termes de soutien à l'éducation, par exemple, des étudiants en médecine.