Des chercheurs de l'Université de l'Oregon ont développé un outil d'intelligence artificielle capable de lire le code génétique de la même manière que les grands modèles de langage comme ChatGPT lisent le texte. En scannant le génome à la recherche de schémas de mutations biologiques, le modèle informatique retrace l'ascendance des gènes à travers différentes espèces, selon une étude publiée dans Nature Communications le 18 mars 2026.
Le modèle d'IA, appelé GenoFormer, a été entraîné sur des données génomiques de plus de 100 000 espèces. Il identifie des schémas de mutations accumulées au fil du temps évolutif, lui permettant de reconstruire des arbres généalogiques de gènes sans connaissance préalable des relations entre espèces. L'auteure principale, le Dr Emily Chen, a déclaré : 'C'est comme avoir un traducteur universel pour le langage de l'ADN.'
Lors des tests, GenoFormer a retracé avec précision l'ascendance des gènes impliqués dans la réponse immunitaire et le métabolisme, correspondant aux arbres évolutifs connus construits par des méthodes traditionnelles. L'outil a également découvert des relations jusqu'alors inconnues entre des gènes de bactéries et de plantes, suggérant d'anciens événements de transfert horizontal de gènes.
L'équipe de l'Université de l'Oregon prévoit de rendre le modèle accessible au public pour d'autres chercheurs. Les applications potentielles incluent le suivi de l'évolution des gènes de résistance aux antibiotiques et la compréhension de l'émergence des maladies à travers les espèces. Les travaux ont été financés par la National Science Foundation.