Similarités et divergences, globales et locales, entre structures protéiques (Similarities and divergencies, global and local, between protein structures) Le Boudic-Jamin, Mathilde - (2015-12-14) / Université de Rennes 1 - Similarités et divergences, globales et locales, entre structures protéiques
| |||
Langue : Français Directeur(s) de thèse: Andonov, Rumen Discipline : Informatique Laboratoire : IRISA Ecole Doctorale : MATISSE Classification : Informatique, information, généralités Mots-clés : Classification supervisée de protéines, apprentissage, dominances, formalisation par des graphes, recherche de cliques, recherche de pseudocliques, analyse d’alignements structuraux, domaines structuraux, permutations circulaires, charnières, répétitions de motifs
| |||
Résumé : Cette thèse s'articule autour de la détection de similarités globales et locales dans les structures protéiques. Premièrement les structures sont comparées, mesurées en termes de distance métrique dans un but de classification supervisée. Cette classification des domaines structuraux au sein de classifications hiérarchiques se fait par le biais de dominances et d'apprentissages permettant d'assigner plus rapidement et de manière exacte de nouveaux domaines. Deuxièmement, nous proposons une méthode de manière de traduire un problème biologique dans les formalisme des graphes. Puis nous résolvons ce problème via le parcours de ces graphes pour extraire les différentes sous-structures similaires. Cette méthode repose sur des notions de compatibilités entre éléments des structures ainsi que des critères de distances entre éléments. Ces techniques sont capables de détecter des événements tels que des permutations circulaires, des charnières (flexibilité) et des répétitions de motifs structuraux. Finalement nous proposons une nouvelle approche dans l'analyse fine de structures afin de faciliter la recherche de régions divergentes entre structures 3D fortement similaires. Abstract : This thesis focusses on local and global similarities and divergences inside protein structures. First, structures are scored, with criteria of similarity and distance in order to provide a supervised classification. This structural domain classification inside existing hierarchical databases is possible by using dominances and learning. These methods allow to assign new domains with accuracy and exactly. Second we focusses on local similarities and proposed a method of protein comparison modelisation inside graphs. Graph traversal allows to find protein similar substructures. This method is based on compatibility between elements and criterion of distances. We can use it and detect events such that circular permutations, hinges and structural motif repeats. Finally we propose a new approach of accurate protein structure analysis that focused on divergences between similar structures. |