Offre de stage master2

Établissement d’une horloge biologique par machine learning en utilisant des données de méthylome et autres données omiques : application à la poule pondeuse

Contexte

Le présent projet entre dans un projet plus large (projet ANR ADAAPT)  visant à mieux comprendre comment les poules pondeuses vieillissent mais pas juste en comptant les semaines de vie mais en regardant l’ADN des tissus. Pour ça, on utilise une sorte de "montre biologique" appelée horloge épigénétique. Dans le cadre de ce projet, une thèse qui débutera en nov. 2026 est déjà financée. La 1ère étape consiste à identifier les marques chimiques dans l’ADN permettant de prédire/estimer l’âge biologique des poules, ceci en utilisant une cohorte de poules d’âges variés (en cours d’acquisition). En effet ces marques appelées méthylations sont connues pour s’accumuler avec l’âge. La 2nde étape consiste à analyser ces marques sur des poules d’un âge donnée (70 et 90 semaines) et de comparer leur âge biologique avec leur âge réel. On peut alors identifier des poules qui vieillissent "plus vite" que prévu ou "plus lentement". Enfin, la 3ème étape est d’évaluer si ces écarts entre âge biologique et âge réel peuvent prédire des écarts de performances pour des caractères d’intérêt tels que le taux de ponte, poids ou qualité des œufs, présence d’ascites, …. De telles prédictions ont été déjà obtenues chez l’humain pour différentes maladies (e.g. cancers, maladies métaboliques, etc). Pourquoi une telle étude est importante ? Parce qu’allonger la durée de production des poules (i.e. passer d’un âge de réforme de 70 semaines à 90 sem. ou plus), présente des avantages économiques, éthiques et environnementaux pour la filière ‘œuf’. Les recherches portant sur la poule à âge avancé (au-delà de 60 sem.) étant quasi inexistantes, ce projet a pour ambition d’apporter de nouvelles connaissances à ces âges. L’objectif du projet de master concerne l’étape 1.

Questions scientifiques et objectif(s) du projet

Différentes horloges épigénétiques ont été développées chez des espèces variées comme le poulet de chair mais jamais encore chez la poule pondeuse. Aussi un des objectif du projet ANR ADAAPT est de créer 2 horloges dans cette espèce, l’une à partir de l’ADN sanguin (collecte non invasive), l’autre à partir de l’ADN hépatique, le foie étant central dans la production d’œufs et les maladies métaboliques. Ces horloges « foie » et « sang » seront établies sur 96 prélèvements effectués juste avant l’abattage et correspondant à 12 poules  x 8 âges différents (20 à 130 semaines). Bien que ce type d’effectif soit courant dans la littérature, il reste relativement faible et pourrait conduire à des prédictions peu fiables. Le stage consistera donc à évaluer la performance de différentes méthodes de machine learning utilisées pour développer ce type d’horloges. Pour cela, des données simulées seront générées avec des profils de sites méthylés dont la vérité est connue : parmi des dizaines de milliers de sites méthylés analysés, quelques centaines seront définis comme variant avec l’âge.

Déroulé /planning prévisionnel

  • Bibliographie sur les méthodes utilisées pour établir les horloges épigénétiques.
  • Générer les données simulées suivant des distributions similaires aux données réelles.
  • Mise en place de benchmarks pour évaluer les capacités de détection et prédiction des approches de Machine Learning « state-of-the-art ».

Co-encadrement et lieu de stage

Sandrine Lagarrigue (Institut Agro), Yann Le Cunff (université de Rennes 1) et Emily Mathieu(Institut Agro) – lieu : Agro - Rennes.

Compétences recherchées

Intérêt pour les méthodes statistiques et la biologie.

Indemnité de stage

Selon réglementation en vigueur.