Détection d'organismes génétiquement modifiés (OGM) inconnus par analyse statistique de données de séquençage haut débit (Detection of unknown genetically modified organisms by statistical analysis of high-throughput sequencing data) Hurel, Julie - (2020-11-13) / Universite de Rennes 1 - Détection d'organismes génétiquement modifiés (OGM) inconnus par analyse statistique de données de séquençage haut débit
| |||
Langue : Français Directeur(s) de thèse: Bougeard, Stéphanie; Touzain, Fabrice Discipline : Génétique, génomique, bioinformatique Laboratoire : ANSES - Ploufragan Ecole Doctorale : EGAAL Classification : Médecine et santé Mots-clés : OGM inconnus, détection, statistiques
| |||
Résumé : L’Union Européenne a adopté une politique très restrictive vis-à-vis de la diffusion et de l’utilisation des organismes génétiquement modifiés (OGM), dont l'utilisation dans l'alimentation est mal acceptée par les consommateurs. Bien qu'un seuil maximal existe pour qu'un aliment soit étiqueté « sans OGM », ne sont aisément détectables que les OGM connus. Un OGM est constitué principalement d’un génome hôte et d’une séquence insérée par un procédé non naturel conférent une propriété particulière à l’organisme comme la résistance à certaines maladies. Depuis quelques années, des OGM dont la séquence insérée n’est pas connue ont été produits, non détectables par des approches utilisées jusqu'à présent (de type PCR). D'où la nécessité de créer un outil de détection d'OGM inconnus, objet de cette thèse, s'appuyant sur les avancées récentes en terme de séquençage haut débit. Statistiquement, chaque organisme a une fréquence d’utilisation des nucléotides dans son génome qui lui est propre. Toute introduction de matériel génétique étranger va modifier localement les fréquences d’utilisation des nucléotides dans cette région, entraînant ainsi des fréquences d’utilisation des nucléotides différentes de celles de l’organisme hôte. En se basant sur cette affirmation, un outil de détection d'OGM inconnu a été mis au point à partir de données de séquençages bactériens dès lors que cet OGM résulte de l'insertion d'un gène étranger, de la troncation ou de la fusion d'un gène pouvant appartenir au génome hôte. L’outil a été testé sur 4 génomes bactériens OGM, 7 génomes bactériens sauvages et sur 42 génomes synthétiques. Les résultats démontrent l’efficacité de la méthode développée ne présentant qu'un gène faux positif et en identifiant plus de 99% des gènes d'inserts OGM. Abstract : The European Union has adopted a very restrictive policy towards the dissemination and use of genetically modified organisms (GMOs), whose use in food is not well accepted by consumers. Although a maximum threshold exists for a food to be labelled "GM-free", only known GMOs are easily detectable. A GMO consists mainly of a host genome and a sequence inserted by a non-natural process that confers a particular property on the organism, such as resistance to certain diseases. In recent years, GMOs with an inserted sequence that is not known have been produced that are not detectable by approaches used until now (PCR-type). Hence the need to propose a tool for the detection of unknown GMOs, the subject of this thesis, based on recent advances in terms of high-throughput sequencing. Statistically, each organism has a specific frequency of nucleotide use in its genome. Any introduction of foreign genetic material will locally alter the nucleotide use frequencies in that region, resulting in different nucleotide use frequencies compared to those of the host organism. Based on this assertion, an unknown GMO detection tool has been developed from bacterial sequencing data when the GMO results from the insertion of a foreign gene, the truncation or fusion of a gene that may belong to the host genome. The tool has been tested on 4 GMO bacterial genomes, 7 wild bacterial genomes and 42 synthetic bacterial genomes. The results demonstrate the effectiveness of the method developed by presenting only one false positive gene and identifying more than 99% of the genes of GMO inserts. |