Vers une meilleure compréhension du génome de la poule

De nouvelles données et une application web (GEGA) pour les explorer

Enrichir l'annotation du génome de la poule

Une bonne connaissance du génome est un élément clé pour comprendre le fonctionnement des êtres vivants. En effet, les gènes constituants le génome et leurs variations d'expression sont des régulateurs majeurs des réponses phénotypiques mis en place pour faire face aux variations environnementales et s'y adapter. En d'autres termes, ils jouent un rôle crucial dans les plasticités (ou adaptations) tissulaires et phénotypiques, domaines importants à étudier dans un contexte de transitions agro-écologiques en élevage. Cependant, l'annotation des génomes peut être très hétérogène entre espèces ou pour une espèce donnée : par exemple les deux bases de données de référence européenne (Ensembl de EBI/EMBL) et américaine (RefSeq du NCBI) fournissent pour une espèce donnée, des informations souvent disparates sur les gènes. Cela concerne notamment les gènes régulateurs de type ARN long non codant (ARNlnc) qui par ailleurs, ne sont que très partiellement identifiés dans ces bases. De plus, le répertoire de réference « expression Atlas » développé par la base européenne est également très peu documenté pour l’espèce poule.

Développement d'un outil pour explorer l'information génomique

Les travaux ont permis le développement de GEGA, un outil en ligne, facile d’utilisation et conçu pour naviguer dans des informations génomiques et fonctionnelles relatives aux milliers de gènes identifiés sur le génome de la poule [1].
GEGA utilise un atlas de gènes que nous avons préalablement généré [2] en unifiant les catalogues de gènes provenant de diverses bases de données, offrant ainsi une couverture en gènes du génome de poule la plus étendue à ce jour. Cet atlas inclut un total de 78 323 gènes, dont 24 102 gènes codant pour des protéines (PCG) et 44 428 gènes régulateurs de type ARNlnc, augmentant ainsi considérablement le nombre de ces gènes encore mal connus par rapport à ceux identifiés dans chaque ressource prise séparément. Les fonctionnalités de GEGA permettent l'exploration des profils d'expression et de co-expression à travers 47 tissus, profils que nous avons établis après séquencage du transcriptome de 1 400 échantillons, issus de 36 projets. GEGA permet également l'analyse des variations d’expression au sein de chaque tissu, et pour certains tissus, entre sexes ou âge différents. En outre, l'outil offre la possibilité d'extraire d’autres informations fonctionnelles issues de base de données existantes. GEGA offre une vue d'ensemble complète et unifiée des gènes de la poule avec de multiples informations associées, très utile pour émettre des hypothèses biologiques quant à la fonction de ces gènes.
Quatre cas d’étude sont ainsi fournis avec l’outil dont un est présenté en figure 1.

analyse Gega
Figure 1 © Degalez et al. 2024

Figure 1 : analyse par GEGA du gène TBX5 pour T-Box Transcription Factor 5. GEGA suggère un rôle fonctionnel spécifique du cœur (cf 1 et 2), ce qui est cohérent avec le rôle connu de ce gène dans la morphogénèse cardiaque des vertébrés. GEGA montre l’existence d’un gène lncRNA antisens de TBX5 (cf 3), connu sous le nom de TBX-AS1 chez l'humain, qui a également une expression cœur-spécifique (non montré ici). GEGA indique une co-expression très élevée de ce gène lncRNA avec le gène TBX5 (cf 4) et une expression de ces deux gènes plus élevée aux stades embryonnaires par rapport aux stades adultes (cf 5). Ce gène lncRNA pourrait être un régulateur de TBX5 ou, du moins, pourrait partager une fonction commune et ce dès le stade embryonnaire. Xe= X jours à l’état d’embryon, d et w =  jour (day) et semaine (week) après éclosion.

Émettre des hypothèses quant à la fonction de certains gènes

GEGA se positionne comme un outil essentiel pour la communauté scientifique s’intéressant à la poule et sera réactualisé à chaque changement majeur de l’annotation du génome dans les deux bases de référence européenne et américaine.

Références bibliographiques

1- Degalez F.,  Bardou O.,  Lagarrigue S. GEGA (Gallus Enriched Gene Annotation): an online tool providing genomics and functional information across 47 tissues for a chicken gene-enriched atlas gathering Ensembl & Refseq genome annotations. 2024 NAR Genomics and Bioinformatics6(3), lqae101. https://doi.org/10.1093/nargab/lqae101.

2- Degalez F, Charles M, Foissac S, Zhou H, Guan D, Fang L, Klopp C, Allain C, Lagoutte L, Lecerf F, Acloque H, Giuffra E, Pitel F, Lagarrigue S. Enriched atlas of lncRNA and protein-coding genes for the GRCg7b chicken assembly and its functional annotation across 47 tissues. Sci Rep. 2024 Mar 19;14(1):6588. https://doi.org/10.1038/s41598-024-56705-y .

Application web : https://gega.sigenae.org/