Imprimer |
Méthode d'apprentissage profond pour l'analyse génomique des cancers canins comme modèles des cancers humains (Deep learning methods for the genomic analysis of canine cancers as models for human cancers) Kergal, Camille - (2022-10-18) / Universite de Rennes 1 - Méthode d'apprentissage profond pour l'analyse génomique des cancers canins comme modèles des cancers humains
| |||
Langue : Français, Anglais Directeur(s) de thèse: Hitte, Christophe; Derrien, Thomas Discipline : Génétique, génomique et bioinformatique Laboratoire : IGDR Ecole Doctorale : Biologie-Santé Classification : Médecine et santé Mots-clés : Apprentissage profond, génomique, cancers, modèle animal
| |||
Résumé : Les méthodes d’apprentissage profond (DL) se sont récemment révélées être de puissantes stratégies pour prédire l’activité régulatrice d’une séquence génomique et donc pour, in fine, évaluer l’impact des mutations régulatrices sur l’expression des gènes. L’outil Basenji propose une approche DL utilisant des réseaux de neurones convolutifs pour prédire le niveau d’expression de gènes humains. Nous avons adapté ce programme pour entraîner un modèle d’expression génique spécifique au chien et montré que ce modèle de prédiction atteignait des performances similaires à celles observées chez l’homme, avec des corrélations élevées entre les niveaux d’expression réels et ceux pré- dits (r=0,66). Pour prédire le niveau d’expression de gènes canins, nous démontrons également que l’utilisation du modèle de prédiction canin (approche intra-espèce) aboutit à de meilleures performances que le modèle humain (approche inter-espèce), notamment en lien avec certaines caractéristiques spécifiques aux séquences canines (niveau de GC, d’éléments transposable et conservation évolutive). Le chien étant un modèle naturel pour l’étude des cancers humains, nous avons également exploité ces modèles pour prédire l’impact de mutations non-codantes sur l’expression de gènes impliqués dans les cancers. Nous avons ainsi localisé 1301 mutations communes entre l’homme et le chien, suggérant un rôle fonctionnel dans la régulation de l’expression de gènes impliqués dans les cancers. Finalement, nos modèles et les outils pour les exploiter sont disponibles sur GitHub : https://github.com/ckergal/BLIMP. Abstract : Deep learning (DL) methods have recently been shown to be powerful strategies for predicting the regulatory activity of a genomic sequence and thus for ultimately assessing the impact of regulatory mutations on gene expression. The Basenji tool proposes a DL approach using convolutional neural networks to predict the expression level of human genes. We adapted this program to train a dog-specific gene expression model and showed that this model achieved similar performance to that observed in humans, with high correlations between real and predicted expression levels (r=0.66). To predict the ex- pression level of canine genes, we show that the canine prediction model (within-species approach) leads to better performances than the human model (cross-species approach), particularly due to some specific features of canine sequences (GC content, transposable elements and evolutionary conservation). As the dog is a spontaneous model for human cancers, we used these models to predict the impact of non-coding mutations on the expression of genes involved in cancers. We identified 1301 common mutations to both humans and dogs, suggesting a functional role in the regulation of the expression of genes involved in cancer. Finally, models and tools to exploit them are available on GitHub: https://github.com/ckergal/BLIMP. |