Soutenance de thèse de Dupuy Rony CHARLES

jeudi 12 décembre 2024

Dupuy Rony CHARLES soutiendra sa thèse de doctorat le jeudi 12 décembre 2024 à 9h30 sur le campus SophiaTech dans la salle du Conseil - bâtiment Templier E - 

La thèse intitulée « Optimisation de l'indice de sélection multi-caractères dans la sélection du maïs grâce à l'apprentissage automatique avancé et à l'analyse robuste de l'incertitude » a été réalisée dans le pôle SPARKS sous la direction de Andrea Tettamanzi.

La présentation sera en français.

 

Résumé :  

L’augmentation de la complexité des programmes modernes de sélection végétale, motivée par la nécessité d’accélérer les cycles de sélection, de gérer durablement les ressources et de répondre aux exigences réglementaires et des consommateurs, nécessite des méthodologies avancées pour optimiser les indices de sélection multi-traits. Cette thèse propose un cadre innovant qui combine des techniques de machine learning de pointe avec une analyse robuste de l’incertitude, afin d’améliorer la précision et l’efficacité des programmes de sélection du maïs.

L’approche proposée relève les défis liés à la qualité des données, à la performance des modèles et à la variabilité environnementale pour optimiser la sélection génomique multi-traits. Tout d’abord, une méthode de détection des valeurs aberrantes pour les données des essais multi-environnements (MET) est développée, utilisant des techniques basées sur les sous-espaces pour renforcer l’intégrité des données phénotypiques et génomiques. Cette étape de pré-traitement est essentielle pour garantir la fiabilité des analyses génomiques ultérieures.

Ensuite, un cadre de machine learning méta-ensemble est introduit, intégrant les machines de Gradient Boosting (GBM), les forêts aléatoires (RF), les réseaux neuronaux profonds (DNN) et les machines à vecteurs de support (SVM). Ce cadre capture les interactions complexes entre les traits et l’environnement, améliorant ainsi la précision des prédictions et soutenant la sélection multi-traits. Pour affiner davantage les prédictions dans des conditions variables, le cadre intègre un clustering environnemental, permettant de partitionner la variabilité environnementale et d’améliorer les prévisions des performances des génotypes dans divers contextes.

Enfin, nous abordons l’incertitude des prédictions en proposant des stratégies avancées de quantification et de réduction au sein du cadre méta-ensemble. Ces approches renforcent la fiabilité des décisions de sélection multi-traits et soutiennent une sélection de précision robuste.

Les méthodologies sont validées à l’aide de jeux de données réels provenant de programmes de sélection du maïs, démontrant des améliorations significatives en termes de précision des prédictions et d’efficacité des programmes. En intégrant des techniques avancées de machine learning, de modélisation environnementale et d’analyse de l’incertitude, cette thèse offre des outils robustes pour faire progresser l’agriculture de précision, permettant aux sélectionneurs de choisir des génotypes de maïs supérieurs dans des environnements complexes et dynamiques.