
BreedOrigin : un logiciel pour l’estimation rapide et précise de l'origine raciale des allèles dans les populations d’animaux croisés
L'estimation de l'origine raciale des allèles (ou « peinture chromosomique ») présente un grand intérêt chez les individus croisés afin de déterminer la composition génétique exacte d'un individu, d'estimer le génotype pour les gènes d'intérêt ou de prédire les valeurs génétiques avec les effets SNP en fonction de leur origine. Par extension, cette approche peut fournir des informations sur les contributions des ancêtres chez les animaux de race pure ou croisés.
Plusieurs algorithmes existent déjà, mais beaucoup d'entre eux sont très gourmands en ressources informatiques. Pour une évaluation routinière à grande échelle des individus croisés, cet algorithme doit être exécuté fréquemment et fournir des résultats rapides sans compromettre la précision. Dans de nombreuses situations, les chaînes d'évaluation génomique comprennent une phase d'imputation et de phasage. Ces informations de phasage peuvent être utilisées efficacement pour estimer l'origine des allèles.
L'algorithme proposé prend en compte des haplotypes de 16 SNP coulissants le long du génome et estime leur fréquence dans chaque race d'origine potentielle à partir d'une population de référence d'individus de race pure. La race de ces individus est supposée être connue avec certitude. L'haplotype d'un individu croisé est ensuite attribué à la race présentant la fréquence la plus élevée du même haplotype. Un rapport de vraisemblance d'au moins 10 est requis pour garantir la précision. L'ensemble du génome est analysé à l'aide d'une fenêtre glissante de 16 SNP avec un pas de 1. Si un petit segment indéterminé est entouré de deux segments de même origine, il est attribué à cette origine. Le processus est répété avec des haplotypes de taille décroissante (jusqu'à un seul SNP) pour combler les lacunes restantes.
Cet algorithme s'est révélé très précis (souvent > 99 %) et au moins 10 fois plus rapide que les alternatives testées. Bien qu'il soit particulièrement adapté aux panels de marqueurs de moyenne densité, il peut également être appliqué à des densités plus élevées, jusqu'au niveau de la séquence, mais une sélection préalable de marqueurs informatifs est recommandée pour garantir la différenciation des haplotypes entre races.
Ce travail s'inscrit dans le cadre du projet européen GenTore (n° 727213) et du projet Evagenoc financé par APIS-GENE.


