|
Tri :
Date
Titre
Auteur
|
|
|
Informatique
/ 29-11-2024
Pinte Caroline
Voir le résumé
Voir le résumé
Cette thèse explore l'apport des méthodes d'apprentissage automatique dans le contexte de la bi-modalité EEG-IRMf, avec pour objectif de localiser automatiquement et précisément les électrodes EEG dans un volume IRM et de prédire des scores neurofeedback IRMf à partir de signaux EEG. La première partie présente le contexte et les outils utilisés, en abordant les modalités EEG et IRMf ainsi que leur combinaison, le neurofeedback, les réseaux de neurones artificiels, la segmentation d'images et la régression de séries temporelles. La deuxième partie comprend trois contributions principales. La première décrit le développement d'une méthode permettant détecter automatiquement la position et l'étiquetage des électrodes EEG dans un volume IRM à l'aide d'une séquence IRM spécifique. La deuxième contribution propose une méthode de recherche d'hyperparamètres d'architecture de modèles basée sur un algorithme génétique. Ces modèles sont ensuite entraînés sur plusieurs sujets afin de prédire des scores neurofeedback IRMf à partir de signaux EEG. Cette étude compare différentes architectures issues de deux catégories de réseaux neuronaux : les LSTMs et les CNNs. Enfin, la troisième contribution consiste à étudier une piste d'amélioration de ces modèles. Ce travail évalue l'impact de la réduction de la variabilité inter-sujet sur les performances, en appliquant un alignement dans l'espace euclidien aux données EEG.
|
|
|
Informatique
/ 28-11-2024
Ruiz Baptiste
Voir le résumé
Voir le résumé
La composition du microbiote intestinal influence diverses maladies et peut être utilisée pour la classification automatique de l'état de santé. Cette thèse propose une méthode intégrant l'annotation fonctionnelle du microbiote intestinal dans un processus de classification automatique pour améliorer l'interprétation des résultats. En utilisant les données taxonomiques et les annotations fonctionnelles via le pipeline EsMeCaTa, un profil fonctionnel du microbiote est établi. Ces profils, microbien et fonctionnel, servent à entraîner des Forêts Aléatoires pour différencier les échantillons malades des témoins. Une sélection automatique des variables basée sur leur importance est itérée jusqu'à la diminution des performances de classification. Les résultats montrent que les profils fonctionnels offrent des performances comparables aux profils microbiens et permettent d'identifier un sous-ensemble robuste de variables discriminantes. Ces variables se sont révélées plus fiables que celles obtenues par des méthodes de référence et ont été validées par une recherche bibliographique. L'analyse des interconnexions entre taxons et annotations fonctionnelles a révélé que certaines annotations importantes sont issues de l'influence cumulative de taxons non sélectionnés.
|
|
|
Informatique
/ 27-11-2024
Faure Roland
Voir le résumé
Voir le résumé
Cette thèse propose des solutions pour améliorer l'assemblage des génomes à partir de lectures de séquençage de troisième génération (lectures longues). Plus précisément, elle se concentre sur l'amélioration de l'assemblage des (méta)génomes contenant plusieurs haplotypes, comme des génomes polyploïdes ou des souches bactériennes proches. Les assembleurs actuels ont du mal à séparer les haplotypes très similaires, et fusionnent généralement des (parties d')haplotypes, ce qui entraîne la perte de polymorphismes et d'hétérozygotie dans l'assemblage final. Ce travail présente une série de méthodes et de logiciels pour obtenir des assemblages contenant des haplotypes bien séparés. Plus précisément, GenomeTailor et HairSplitter transforment un assemblage obtenu avec des lectures longues erronées en un assemblage phasé, améliorant considérablement l'état de l'art lorsque de nombreuses souches sont présentes. Le logiciel Alice propose une nouvelle méthode, basée sur des nouveaux sketchs ``MSR'', pour assembler efficacement plusieurs haplotypes séquencés avec des lectures de haute fidélité. Enfin, cette thèse propose une nouvelle stratégie de scaffolding Hi-C basée sur le démêlage des graphes d'assemblage qui améliore considérablement les assemblages finaux, en particulier lorsque plusieurs haplotypes sont présents.
|
|
|
Signal, image, vision
/ 26-11-2024
Petit Claude
Voir le résumé
Voir le résumé
Dans cette thèse, nous étudions trois aspects du problème de réduction de la dimension. Le premier concerne la compression de base de données. Nous proposons plusieurs algorithmes d’échantillonnage préservant l’information contenue dans les données, ainsi que deux applications au conditionnement de matrices et à l’acquisition comprimée. Ces algorithmes sont déterministes et leur faible complexité en font une alternative intéressante aux meilleurs algorithmes connus. Le second aspect abordé concerne la sparsification de graphe. Nous proposons de réduire le nombre d’arêtes d’un graphe tout en préservant sa connectivité. Nous élaborons deux algorithmes itératifs, déterministes et de faible complexité, permettant d’approcher la solution de ce problème NP-difficile. Nous présentons également une application possible à la simplification du graphe sous-jacent à un réseau neuronal sur graphe. La troisième partie de la thèse traite d’acquisition comprimée et propose une analyse statistique d’un algorithme de reconstruction de signaux parcimonieux. Dans le cadre d’un modèle asymptotique où la matrice de mesure et le signal sont aléatoires et pour lequel les paramètres de taille tendent vers l’infini à la même vitesse, nous montrons que la probabilité de succès à une itération donnée tend vers 1.
|
|
|
Signal, image, vision
/ 25-11-2024
Gu Kai
Voir le résumé
Voir le résumé
Cette thèse examine les systèmes d’imagerie omnidirectionnelle avancés, la capture de champs lumineux et les pipelines de rendu, ainsi que le dernier paradigme de reconstruction de scènes, le champ de radiance (Radiance Field, RF). Elle traite des défis clés liés à l’utilisation du RF pour la représentation de champs lumineux sphériques et la reconstruction de scènes. Les principales contributions sont les suivantes : Tout d’abord, nous étendons les Champs de Radiance Neuronaux (NeRF) pour prendre en charge les entrées d’images omnidirectionnelles en intégrant un modèle de caméra fisheye optimisable. Cela permet la reconstruction de scènes à 360 degrés avec des images grand angle, en mettant l’accent sur l’échantillonnage de rayons sphériques. Ensuite, nous améliorons la reconstruction de scènes à 360 degrés à partir d’images omnidirectionnelles éparses en combinant l’estimation de points de fuite avec un encodage fréquentiel dans un cadre d’encodage de hachage efficace. Enfin, nous intégrons des techniques de segmentation d’images 2D de haute qualité pour contraindre les objets dans des espaces 3D limités, améliorant ainsi la précision de la reconstruction de scènes et la segmentation cohérente en 3D.
|
|
|
Informatique
/ 21-11-2024
Wadoux Lily
Voir le résumé
Voir le résumé
Les avancées récentes ont élargi le champ des possibles en synthèse de parole, en particulier pour les systèmes multi-locuteurs. Le clonage de voix correspond à la production de parole ressemblant à la voix d'un locuteur cible à partir d'une entrée textuelle et d'un échantillon audio de la cible. En théorie, ils sont capables de synthétiser la voix de n'importe quel locuteur, à partir d'un corpus audio de référence de quelques minutes seulement. Dans ce document, deux questions sont au cœur des raisonnements et des expériences présentées : Si le clonage de voix peut, en théorie, reproduire la voix de n'importe quel locuteur, alors comment se comporterait-il face à des locuteurs atypiques ? Cet axe est exploré dans ce document en premier lieu à travers des données issues de livres audio, puis avec des études préliminaires visant à une application pour les patients atteints de dysphonie. La grande majorité des études portant sur le clonage de voix sont entraînées et testées sur des données en anglais. Serait-il possible, et avec quelles performances, d'entraîner un modèle de clonage de voix dans une autre langue et de le tester avec des locuteurs parlant cette langue ? Cette question est abordée dans ce document avec le choix de la langue française, qui restreint les possibilités en termes de disponibilité de corpus, et implique des compromis entre qualité et nombre de locuteurs.
|
|
|
Télécommunications
/ 21-11-2024
Chillet Alice
Voir le résumé
Voir le résumé
L’identification de dispositifs dits sensibles est soumise à différentes contraintes de sécurité ou de consommation d’énergie, ce qui rend les méthodes d’identification classiques peu adaptées. Pour répondre à ces contraintes, il est possible d’utiliser les défauts intrinsèques de la chaîne de transmission des dispositifs pour les identifier. Ces défauts altèrent le signal transmis et créent alors une signature par nature unique et non reproductible appelée empreinte Radio Fréquence (RF). Pour identifier un dispositif grâce à son empreinte RF, il est possible d’utiliser des méthodes d’estimation d’imperfections pour extraire une signature qui peut être utilisée par un classifieur, ou bien d’utiliser des méthodes d’apprentissage telles que les réseaux de neurones. Toutefois, la capacité d’un réseau de neurones à reconnaître les dispositifs dans un contexte particulier dépend fortement de la base de données d’entraînement. Dans cette thèse, nous proposons un générateur de bases de données virtuelles basé sur des modèles de transmission et d’imperfections RF. Ces bases de données virtuelles permettent de mieux comprendre les tenants et aboutissants de l’identification RF et de proposer des solutions pour rendre l’identification plus robuste. Dans un second temps, nous nous intéressons aux problématiques de complexité de la solution d’identification via deux axes. Le premier consiste à utiliser des graphes programmables intriqués, qui sont des modèles d’apprentissage par renforcement, basés sur des techniques d’évolution génétique moins complexes que les réseaux de neurones. Le second axe propose l’utilisation de l’élagage sur des réseaux de neurones de la littérature pour réduire la complexité de ces derniers.
|
|
|
Informatique
/ 19-11-2024
Gnibga Wedan Emmanuel
Voir le résumé
Voir le résumé
Pour répondre aux exigences croissantes de faible latence des applications, le paradigme de Edge computing vise à placer des ressources de calcul et de stockage aux extrémités du réseau afin de rapprocher les services numériques des utilisateurs. Cependant, cela constitue une duplication de ressources, engendrant un impact environnemental inquiétant qui vient s’ajouter à celui des centres de données existants. De plus, les centres de données sont de gros consommateurs d’énergie, émettent des gaz à effet de serre et consomment des quantités importantes d'eau pour fonctionner. Cette thèse a pour objectif de limiter l'empreinte environnementale des centres de données, notamment leur consommation d'énergie, leurs émissions de gaz à effet de serre et leur consommation d'eau. Nous nous intéressons particulièrement à leur alimentation à base de sources d'énergies renouvelables, à la baisse de leur consommation électrique, à la synchronisation de leur consommation électrique avec la production des sources d'énergie verte, et à l'optimisation des systèmes de refroidissement à eau.
|
|
|
Signal, image, vision
/ 18-11-2024
Bella Adrien
Voir le résumé
Voir le résumé
Dans cette thèse, le cycle de vie de la marée interne et sa perte de cohérence par ses interactions avec les courants sont étudiés dans l’Atlantique Nord à l’aide d’une simulation d’un océan réaliste à haute résolution. Une décomposition en mode verticaux est utilisée pour obtenir le budget d’énergie des différentes échelles de la marée interne. La dispersion topographique est dominante à l’échelle du bassin et aux niveaux des reliefs, tandis que les interactions entre la marée interne et la circulation basse fréquence signent au niveau du Gulf Stream, de son prolongement Nord Atlantique et dans le Nord du Bassin. Enfin, une décomposition en partie cohérente/incohérente est utilisée. Les causes de la perte de cohérence de la marée sur des échelles de un à trois mois sont l’advection de la marée interne par l’écoulement lentement variable et le cisaillement horizontal de ce dernier. Cette perte de cohérence se fait majoritairement sans changement d’échelle pour la marée.
|
|
|
Informatique
/ 13-11-2024
Gauriau Olivier
Voir le résumé
Voir le résumé
Cette thèse se concentre sur la prédiction de la dynamique des maladies des plantes et les informations qui peuvent être tirées des modèles obtenus. Pour trouver un compromis entre la performance et la complexité du modèle, on a utilisé des modèles de complexité intermédiaire dits pattern-based. L’objectif était de parvenir à obtenir des modèles de ce type suffisamment performants en se basant sur des données météorologiques (comme les précipitations et l'ensoleillement) et agronomiques. Ces modèles ont été comparés à des modèles couramment utilisés en protection des cultures d’un point de vue du tradeoff entre la complexité et les performances des modèles. Compte tenu du caractère hybride des modèles pattern-based, on a cherché à comparer leurs structures et les informations qu’ils fournissent aux autres modèles. Ceci nous a permis de confirmer que les modèles pattern-based s’approchent des modèles plus complexes (RF, Gradient-Boosting…) tout en restant plus simples à comprendre. Ceci nous permet de supposer que les explications fournies par ces modèles sont pertinentes. Enfin, ces modèles ont été utilisés dans la mise au point d’un outil de visualisation : Cet outil a été mis au point en collaboration avec des experts agronomes d’instituts techniques pour obtenir un résultat adapté à leurs besoins. Cela a permis d’isoler des principes importants pour eux, comme la notion de contraste des informations fournies. L’outil permet de visualiser les facteurs agronomiques et météorologiques les plus impactants sur un ensemble de parcelles défini.
|
|