L’apprentissage automatique peut identifier les « gènes d’importance » qui aident les cultures à pousser avec moins d’engrais, selon une nouvelle étude publiée dans Communication Nature. Il peut également prédire des traits supplémentaires chez les plantes et les conséquences des maladies chez les animaux, illustrant ses applications au-delà de l’agriculture.
L’utilisation de données génomiques pour prédire les résultats en agriculture et en médecine est à la fois une promesse et un défi pour la biologie des systèmes. Les chercheurs ont travaillé pour déterminer la meilleure façon d’utiliser la vaste quantité de données génomiques disponibles pour prédire comment les organismes réagissent aux changements dans la nutrition, les toxines et l’exposition aux agents pathogènes, ce qui à son tour éclairerait l’amélioration des cultures, le pronostic des maladies, l’épidémiologie et la santé publique. . Cependant, prédire avec précision des résultats aussi complexes en agriculture et en médecine à partir d’informations à l’échelle du génome reste un défi important.
Dans le Communication Nature étude, des chercheurs et des collaborateurs de NYU aux États-Unis et à Taïwan ont relevé ce défi en utilisant l’apprentissage automatique, un type d’intelligence artificielle utilisé pour détecter des modèles dans les données.
« Nous montrons que se concentrer sur les gènes dont les modèles d’expression sont conservés de manière évolutive à travers les espèces améliore notre capacité à apprendre et à prédire les » gènes d’importance « pour les performances de croissance des cultures de base, ainsi que les résultats des maladies chez les animaux », ont expliqué Gloria Coruzzi, Carroll & Milton Petrie Professeur au Département de biologie et au Centre de génomique et de biologie des systèmes de NYU et auteur principal de l’article.
Notre approche exploite la variation naturelle de l’expression à l’échelle du génome et des phénotypes associés au sein ou entre les espèces. Nous montrons que réduire notre contribution génomique aux gènes dont les modèles d’expression sont conservés au sein et entre les espèces est un moyen biologiquement fondé pour réduire la dimensionnalité des données génomiques, ce qui améliore considérablement la capacité de nos modèles d’apprentissage automatique à identifier quels gènes sont importants pour un trait. »
Chia-Yi Cheng, auteur principal de l’étude, Center for Genomics and Systems Biology, New York University
Chia-Yi Cheng est également associée à l’Université nationale de Taiwan.
Comme preuve de concept, les chercheurs ont démontré que les gènes dont la réactivité à l’azote sont conservés au cours de l’évolution entre deux espèces végétales diverses : l’Arabidopsis, une petite plante à fleurs largement utilisée comme organisme modèle en biologie végétale, et les variétés de maïs, la plus grande d’Amérique crop-; a considérablement amélioré la capacité des modèles d’apprentissage automatique à prédire les gènes importants pour l’efficacité avec laquelle les plantes utilisent l’azote. L’azote est un nutriment crucial pour les plantes et le principal composant des engrais ; les cultures qui utilisent plus efficacement l’azote poussent mieux et nécessitent moins d’engrais, ce qui présente des avantages économiques et environnementaux.
Les chercheurs ont mené des expériences qui ont validé huit facteurs de transcription principaux en tant que gènes importants pour l’efficacité d’utilisation de l’azote. Ils ont montré que l’altération de l’expression des gènes chez Arabidopsis ou le maïs pouvait augmenter la croissance des plantes dans les sols à faible teneur en azote, qu’ils ont testés à la fois en laboratoire à NYU et dans des champs de maïs à l’Université de l’Illinois.
« Maintenant que nous pouvons prédire avec plus de précision quels hybrides de maïs sont les meilleurs pour utiliser les engrais azotés au champ, nous pouvons rapidement améliorer cette caractéristique. L’augmentation de l’efficacité de l’utilisation de l’azote dans le maïs et d’autres cultures offre trois avantages clés en réduisant les coûts des agriculteurs, en réduisant la pollution de l’environnement, et l’atténuation des émissions de gaz à effet de serre provenant de l’agriculture », a déclaré l’auteur de l’étude Stephen Moose, Alexander Professor of Crop Sciences à l’Université de l’Illinois à Urbana-Champaign.
De plus, les chercheurs ont prouvé que cette approche d’apprentissage automatique informée sur l’évolution peut être appliquée à d’autres traits et espèces en prédisant des traits supplémentaires dans les plantes, notamment la biomasse et le rendement d’Arabidopsis et du maïs. Ils ont également montré que cette approche peut prédire les gènes importants pour la résistance à la sécheresse dans une autre culture de base, le riz, ainsi que les conséquences des maladies chez les animaux grâce à l’étude de modèles murins.
« Parce que nous avons montré que notre pipeline informé sur l’évolution peut également être appliqué aux animaux, cela souligne son potentiel à découvrir des gènes importants pour tout trait physiologique ou clinique d’intérêt en biologie, en agriculture ou en médecine », a déclaré Coruzzi.
« De nombreux traits clés d’importance agronomique ou clinique sont génétiquement complexes et il est donc difficile de déterminer leur contrôle et leur héritage. Notre succès prouve que la réflexion au niveau des données et des systèmes peut rendre ces défis notoirement difficiles à relever », a déclaré l’auteur de l’étude, Ying Li, professeur. au Département d’horticulture et d’architecture paysagère de l’Université Purdue.