Comparer des structures de gènes pour la prédiction de transcrits alternatifs codants chez l'humain, la souris et le chien (To compare gene structures for prediction of alternative coding transcripts in human, mouse and dog) Guillaudeux, Nicolas - (2021-12-16) / Universite de Rennes 1 - Comparer des structures de gènes pour la prédiction de transcrits alternatifs codants chez l'humain, la souris et le chien
| |||
Langue : Français Directeur(s) de thèse: Dameron, Olivier; Belleannée, Catherine; Blanquart, Samuel Discipline : Informatique Laboratoire : IRISA Ecole Doctorale : MATHSTIC Classification : Informatique Mots-clés : bioinformatique, génomique comparative, épissage alternatif, transcription alternative, orthologie, prédiction de transcrits
| |||
Résumé : Les organismes vivants sont capables d'exprimer plusieurs transcrits (ou ARN) alternatifs à partir d'un même gène. Ces transcrits sont responsables des mécanismes de régulation de l'organisme, certains sont traduits en protéine. Détecter l'ensemble des transcrits pouvant être exprimés par un gène est aujourd'hui un problème ouvert auquel de nombreuses méthodes informatiques telles que le séquençage des données de l'ARN, les méthodes d'alignements de séquences épissées ou encore les méthodes de génomiques comparative tentent de répondre. Cette thèse propose une méthode de génomique comparative permettant de comparer la séquence de gènes partagés par plusieurs espèces. Il en résulte une méthode de prédiction de transcrits à une échelle multi-espèces, en s'appuyant sur une structure de graphes. Cette méthode a été appliquée à trois espèces (humain, souris, chien). Elle a permis de prédire un nombre important de transcrits et d'identifier un ensemble de gènes conservés entre les trois espèces et partageant les mêmes structures exoniques et les mêmes CDS. Abstract : Living organisms are capable of expressing several alternative transcripts (or RNAs) from a single gene. These transcripts are responsible for the regulatory mechanisms of the organism, some of them are translated into protein. Today, detecting the set of transcripts that can be expressed by a gene is an open problem to which many computational methods such as RNA sequencing, spliced sequence alignment methods or comparative genomics methods try to address. This thesis proposes a comparative genomics method to compare the sequence of genes shared by several species. The result is a method for predicting transcripts on a multi-species scale, based on a graph structure. This method was applied to three species (human, mouse, and dog). It allowed to predict a relevant number of transcripts as well as to identify a set of genes that are conserved between the three species and that share both the same exonic structures and the same CDS. |