Imprimer |
Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome (Novel pattern mining techniques for genome-wide association studies) Pham, Hoang Son - (2017-12-22) / Universite de Rennes 1, Rennes 1 - Nouvelles techniques d'extraction de motif pour l'étude d'association à l'échelle du génome
| |||
Langue : Anglais Directeur(s) de thèse: Lavenier, Dominique; Termier, Alexandre Discipline : Informatique Laboratoire : IRISA Ecole Doctorale : MATHSTIC Classification : Informatique Mots-clés : étude d'association à l'échelle du génome, patterns discriminatifs, visualisation, Mesure de la force d'association
| |||
Résumé : Les études d'association sur un génome complet (GWAS) sont conçues pour découvrir les combinaisons de points de polymorphisme (SNP) associées à des maladies. La découverte de ces associations permet d'élaborer de meilleures stratégies pour détecter, traiter ou prévenir les maladies. Récemment, l'utilisation de techniques d'extraction de patterns discriminatif a été investiguée dans le cadre de problématiques GWAS. Toutefois, la découverte de combinaisons de SNP dans de grands jeux de données GWAS est encore difficile à cause de la complexité des algorithmes utilisés. La thèse se propose donc d'améliorer l'état de l'art des approches d'extraction de motifs discriminants, dans le cadre d'extraction de combinaisons de SNP corrélées à un phénotype d'intérêt. Plusieurs solutions ont été proposées, s'attaquant aux problèmes majeurs en GWAS : évaluation de la force d'association, découverte efficace de combinaisons de SNP et visualisation de ces combinaisons. Les approches proposées sont également prometteuses pour d'autres tâches de bioinformatique comme la découverte d'expressions génique, la détection de motifs de phosphorylation et la détection de motifs de régulation. Abstract : Discovering high-order SNP combinations associated with diseases is an important task of bioinformatics. Once new genetic associations are identified, they can be used to develop better trategies to detect, treat and prevent the diseases. Recently, this issue has been effectively tackled with discriminative pattern mining algorithms. However, the number of SNPs is often very large, discovering of SNP combinations remains many challenges. To address these challenges this thesis has been advanced the state-of-the-art discriminative pattern mining techniques to discover SNP combinations associated with interesting phenotype. Different solutions have been proposed in this thesis to tackle GWAS analysis. These solutions focus on efficient association strength evaluation, statistically significant discriminative SNP combinations discovery and interesting SNP combinations visualization. The solutions proposed in this thesis are also promising for other tasks of bioinformatics such as differential gene expression discovery, phosphorylation motifs detection and regulatory motif combination mining. |