Dossiers et publications Détail article 

Intelligence artificielle et prédictions génomiques

Publié le par Fatima Shokor (INRAE), Pascal Croiseau (INRAE)
Issues des développements autour de l’intelligence artificielle, les méthodes de machine learning offrent l’opportunité d’améliorer les modèles de prédiction des valeurs génétiques des animaux. Au cours de sa thèse, Fatima Shokor va en particulier chercher à améliorer la précision des modèles multi-caractères grâce au machine learning.

 

Prédire la valeur génétique de tous les individus pour tous les caractères d’intérêt

La prédiction génomique consiste à prédire la valeur génétique (VG) d’un individu à partir de marqueurs génétiques - comme les SNPs (Single Nucleotid Polymorphisms), qui couvrent l’ensemble du génome. Les animaux sont sélectionnés en utilisant les VG dans l'intention d'améliorer un caractère précis à la génération suivante. Cette prédiction est réalisée en utilisant des méthodes statistiques – les plus répandues étant le GBLUP ou les approches Bayésiennes. Ainsi, à partir des informations de génotypages et de mesures phénotypiques, il est possible de prédire la valeur génétique des individus dès leur naissance pour tous les caractères d’intérêt.

 

Utiliser les caractères corrélés pour améliorer la prédiction

Il est également possible de prédire la valeur génétique d’un caractère en exploitant les informations issues d’un autre caractère corrélé au caractère d’intérêt (modèle multi-caractère). Dans ce cas, les méthodes d’évaluations génétiques utilisées reposent sur l’hypothèse d’une relation linéaire entre ces caractères, ce qui n’est pas toujours vrai. Dans ce contexte, les individus dont la génétique diffère substantiellement de la majorité de la population présenteront une plus grande erreur dans l’estimation de leur valeur génétique.

 

Le machine learning n’est pas plus performant pour les modèles génétiques simples…

Le développement de l’intelligence artificielle a produit de nouveaux outils qui pourraient être appliqués aux évaluations génomiques. Récemment, de nombreuses études ont tenté d’améliorer la précision des prédictions génomiques par l’utilisation de techniques d’apprentissage automatique (Machine Learning ou ML). Ces études ont montré que les approches ML, et en particulier les techniques d’apprentissage en profondeur (Deep Learning ou DL), un sous ensemble des approches ML, peuvent atteindre une précision des prédictions génomique équivalente à celles obtenues par les méthodes traditionnelles. Cependant, ces approches n’ont pas permis une amélioration significative de la précision des prédictions1.

 

… mais il peut améliorer les évaluations multi-caractères

Malgré cela, les applications du DL ne doivent pas se limiter à l'obtention de VG et peuvent être appliquées de manière innovante pour améliorer les programmes de sélection. Dans cette thèse, nous souhaitons exploiter la capacité des approches de DL à prendre en compte des relations non linéaires pour étudier les relations entre les différents caractères. Le but est d’améliorer les prédictions issues des modèles multi caractères et produire un indice de sélection innovant et fiable.

 

Une application pour les évaluations en croisement

Dans un second temps, nous souhaitons étendre cette étude à la mise en place de schémas d'accouplement en utilisant ces indices de sélection, en particulier dans un contexte d’évaluation génomique en croisement.

 

Références

1Montesinos-López, O.A., Montesinos-López, A., Pérez-Rodríguez, P. et al. A review of deep learning applications for genomic selection. BMC Genomics 22, 19 (2021). https://doi.org/10.1186/s12864-020-07319-x