|
|<
<< Page précédente
1
2
3
4
5
6
Page suivante >>
>|
|
documents par page
|
Tri :
Date
Titre
Auteur
|
|
Informatique
/ 01-07-2024
Venkataramanan Shashanka
Voir le résumé
Voir le résumé
Le principal objectif de la vision par ordinateur est de permettre aux machines d'extraire des informations significatives à partir de données visuelles, telles que des images et des vidéos, et de tirer parti de ces informations pour effectuer une large gamme de tâches. À cette fin, de nombreuses recherches se sont concentrées sur le développement de modèles d'apprentissage profond capables de coder des représentations visuelles complètes et robustes. Une stratégie importante dans ce contexte consiste à préentraîner des modèles sur des ensembles de données à grande échelle, tels qu'ImageNet, pour apprendre des représentations qui peuvent présenter une applicabilité transversale aux tâches et faciliter la gestion réussie de diverses tâches en aval avec un minimum d'effort. Pour faciliter l'apprentissage sur ces ensembles de données à grande échelle et coder de bonnes représentations, des stratégies complexes d'augmentation des données ont été utilisées. Cependant, ces augmentations peuvent être limitées dans leur portée, étant soit conçues manuellement et manquant de diversité, soit générant des images qui paraissent artificielles. De plus, ces techniques d'augmentation se sont principalement concentrées sur le jeu de données ImageNet et ses tâches en aval, limitant leur applicabilité à un éventail plus large de problèmes de vision par ordinateur. Dans cette thèse, nous visons à surmonter ces limitations en explorant différentes approches pour améliorer l'efficacité et l'efficience de l'apprentissage des représentations. Le fil conducteur des travaux présentés est l'utilisation de techniques basées sur l'interpolation, telles que mixup, pour générer des exemples d'entraînement diversifiés et informatifs au-delà du jeu de données original. Dans le premier travail, nous sommes motivés par l'idée de la déformation comme un moyen naturel d'interpoler des images plutôt que d'utiliser une combinaison convexe. Nous montrons que l'alignement géométrique des deux images dans l'espace des caractéristiques permet une interpolation plus naturelle qui conserve la géométrie d'une image et la texture de l'autre, la reliant au transfert de style. En nous appuyant sur ces observations, nous explorons la combinaison de mix6up et de l'apprentissage métrique profond. Nous développons une formulation généralisée qui intègre mix6up dans l'apprentissage métrique, conduisant à des représentations améliorées qui explorent des zones de l'espace d'embedding au-delà des classes d'entraînement. En nous appuyant sur ces insights, nous revisitons la motivation originale de mixup et générons un plus grand nombre d'exemples interpolés au-delà de la taille du mini-lot en interpolant dans l'espace d'embedding. Cette approche nous permet d'échantillonner sur l'ensemble de l'enveloppe convexe du mini-lot, plutôt que juste le long des segments linéaires entre les paires d'exemples. Enfin, nous explorons le potentiel de l'utilisation d'augmentations naturelles d'objets à partir de vidéos. Nous introduisons un ensemble de données "Walking Tours" de vidéos égocentriques en première personne, qui capturent une large gamme d'objets et d'actions dans des transitions de scènes naturelles. Nous proposons ensuite une nouvelle méthode de préentraînement auto-supervisée appelée DoRA, qui détecte et suit des objets dans des images vidéo, dérivant de multiples vues à partir des suivis et les utilisant de manière auto-supervisée.
|
|
Informatique
/ 18-06-2024
Jeudy Corentin
Voir le résumé
Voir le résumé
La transition vers la cryptographie post-quantique est une tâche considérable ayant suscité un nombre important de travaux ces dernières années. En parallèle, la cryptographie pour la protection de la vie privée, visant à pallier aux limitations inhérentes des mécanismes cryptographiques basiques dans ce domaine, a connu un véritable essor. Malgré le succès de chacune de ces branches prises individuellement, combiner les deux aspects de manière efficace s'avère extrêmement difficile.
Le but de cette thèse de doctorat consiste alors à proposer de nouvelles constructions visant à garantir une protection efficace et post-quantique de la vie privée, et plus généralement des mécanismes d'authentification avancés. Dans ce but, nous nous consacrons tout d'abord à l'étude de l'une des hypothèses mathématiques fondamentales utilisées en cryptographie sur les réseaux Euclidiens: Module Learning With Errors. Nous prouvons que le problème ne devient pas significativement plus facile même en choisissant des distributions de secret et d'erreur plus courtes. Ensuite, nous proposons des optimisations des échantillonneurs d'antécédents utilisés par de nombreuses signatures avancées. Loin d'être limitées à ce cas d'usage, nous montrons que ces optimisations mènent à la conception de signatures standards efficaces. Enfin, à partir de ces contributions, nous concevons des algorithmes de signatures avec protocoles efficaces, un outil polyvalent utile à la construction d'applications avancées. Nous en montrons les capacités en proposant le premier mécanisme d'accréditation anonyme post-quantique, que nous implémentons afin de mettre en exergue son efficacité aussi bien théorique que pratique.
|
|
Informatique
/ 13-06-2024
Hoarau Arthur
Voir le résumé
Voir le résumé
Ce document expose les recherches effectuées dans le cadre d'une thèse sur l'apprentissage actif de données incertaines et imprécises, soutenue grâce au financement de la Région Bretagne et du département Côtes-d'Armor. Deux principaux axes de recherche ont été explorés : les fonctions de croyance pour modéliser l'incertitude dans les données, et l'apprentissage actif pour travailler avec un nombre limité d'observations labellisées. La thèse s'est penchée sur la qualité et la quantité des labels en apprentissage automatique, visant à améliorer la modélisation des labels (qualité) tout en réduisant les coûts de labellisation (quantité). Des jeux de données à labels riches ont été proposés et mis à la disposition de la communauté scientifique. De nouveaux modèles ont été développés, des arbres de décision et des forêts aléatoires crédibilistes, tous capables de produire des prédictions incertaines et imprécises. Deux méthodes d'échantillonnage, fondées sur l'incertitude crédibiliste, ont été proposées et ont montré une augmentation des performances en apprentissage actif sur des jeux de données classiques. Enfin, des perspectives de recherche future ont été envisagées, notamment l'amélioration des méthodes d'échantillonnage par incertitude crédibiliste. Les travaux en cours comprennent la comparaison de la méthode proposée avec d'autres modèles de décomposition d'incertitudes, en se basant sur des recherches récentes liées à la thèse.
|
|
Informatique
/ 24-05-2024
Younes Mohamed
Voir le résumé
Voir le résumé
Cette thèse étudie l’extraction et la simulation des interactions entre combattants, principalement pour la boxe, en utilisant des techniques d’apprentissage profond : l’estimation du mouvement humain à partir de vidéos, l’apprentissage par imitation basé sur l’apprentissage par renforcement, et la simulation de personnages basée sur la physique. Dans le contexte de l’analyse sportive à partir de vidéos, un protocole de référence est proposé dans lequel diverses méthodes contemporaines d’extraction de poses humaines en 2D sont évaluées pour leur précision à dériver des informations positionnelles à partir d’enregistrements vidéo RVB de boxeurs lors de mouvements complexes et dans des circonstances de tournage défavorables. Dans une deuxième partie, la thèse se concentre sur la reproduction d’interactions réalistes entre boxeurs à partir de données de mouvement et d’interaction grâce à une méthodologie innovante permettant d’imiter les interactions et les mouvements de plusieurs personnages simulés physiquement à partir de données de capture de mouvement non organisées. Initialement, cette technique a été démontrée pour simuler une boxe légère entre deux combattants sans contact physique significatif. Par la suite, elle a été étendue pour prendre en compte des données d’interaction supplémentaires concernant la boxe avec du contact physique réel et d’autres activités de combat, ainsi que pour gérer les instructions de l’utilisateur et les restrictions d’interaction.
|
|
Informatique
/ 22-04-2024
Tit Karim
Voir le résumé
Voir le résumé
Cette thèse étudie la fiabilité des réseaux de neurones profonds en utilisant des algorithmes de simulation d’événements rares dans le cadre de l’ingénierie de la fiabilité statistique. L’objectif est d’évaluer et d’améliorer la robustesse de ces réseaux dans des situations peu communes mais cruciales. La recherche se concentre sur le développement de nouvelles méthodes statistiques spécifiquement pour les réseaux de neurones profonds. Ces méthodes sont conçues pour mieux comprendre comment ces réseaux se comportent face à des données inhabituelles ou corrompues. Une réalisation clé est la création d’un nouvel algorithme qui améliore l’applicabilité des techniques d’échantillonnage d’importance aux classificateurs différentiables, une caractéristique commune dans les modèles modernes d’apprentissage profond. L’étude met en évidence les difficultés d’application des méthodes traditionnelles de fiabilité statistique aux données complexes et de grande dimension typiques en apprentissage profond. Malgré ces défis, les résultats offrent des outils et des approches qui peuvent être appliqués à divers modèles d’apprentissage profond.
|
|
Automatique, productique et robotique
/ 18-04-2024
Carli Nicola de
Voir le résumé
Voir le résumé
Dans cette thèse, nous nous attaquons aux défis de la localisation des systèmes multi-robots, en nous concentrant sur la localisation coopérative dans des formations non infiniment rigides avec des contraintes de détection. Nos contributions introduisent un cadre dans lequel les objectifs éventuellement conflictuels du maintien de la connectivité, de l'exécution des tâches et de l'acquisition d'informations sont "médiés" à l'aide d'un programme quadratique et des fonctions de barrière de contrôle et du formalisme de la fonction de Lyapunov de contrôle. Une autre contribution de cette thèse concerne la localisation active distribuée de cibles mobiles multiples par un groupe de robots volants utilisant des mesures basées sur des caméras, tout en accommodant d'autres tâches si la redondance du système le permet. Dans ce cas également, la formulation du problème utilise un programme quadratique et des fonctions de barrière de contrôle. En nous appuyant sur la fonction de barrière de contrôle et le cadre du programme quadratique, nous identifions et abordons les limites de l'état actuel de la technique, en particulier en ce qui concerne les fonctions de barrière de contrôle distribuées. Nos modifications aboutissent à un contrôleur qui converge vers la solution optimale centralisée. Enfin, nous présentons une méthodologie d'observation comme une nouvelle contribution, facilitant la localisation coopérative d'un système multi-robots dans un cadre commun en utilisant des mesures relatives au cadre du corps.
|
|
Automatique, productique et robotique
/ 17-04-2024
THOMAS JOHN
Voir le résumé
Voir le résumé
Dans cette thèse, un système multi-sensoriel composé de capteurs proximétriques, appelé réseau proximétriques, est proposé. En l’attachant à l’effecteur, il permet à un robot d’effectuer des tâches de positionnement plan sur plan et de positionnement par rapport à un cylindre. L’analyse de la stabilité de la tâche de positionnement plan sur plan est effectuée en obtenant la forme explicite pour la pseudo-inverse de la matrice d’interaction. Les informations de proximité et de vision sont ensuite combinées pour traiter le positionnement dans un espace encombré pour une tâche d’assemblage à l’aide de capteurs sans contact dans le cadre de la commande référencée multi-capteurs. Le réseau proximétrique est enroulé autour du bras du manipulateur pour permettre d’éviter les collisions alors que l’asservissement visuel à partir de 4 points assure le positionnement. Divers résultats expérimentaux et de simulation sont fournis pour valider la théorie. Des formes explicites de la base duale sont obtenues pour des tâches incluant le suivi plan sur plan et le positionnement par rapport à un cylindre avec un
minimum de capteurs et un asservissement visuel à partir de 3 points. La base duale est associée à l’espace linéaire des torseurs d’interaction qui forment les composantes de la matrice d’interaction. Cela conduit à des équations explicites capteurs.
|
|
Informatique
/ 16-04-2024
Yin Tairan
Voir le résumé
Voir le résumé
Les données sur les mouvements de foule sont essentielles pour comprendre et simuler des comportements de foule. Ces données sont toutefois rares en raison des multiples difficultés liées à leur collecte. La réalité virtuelle (RV) a été utilisée pour étudier le comportement individuel dans les foules, généralement en immergeant les utilisateurs dans des foules virtuelles et en capturant leur comportement. Dans cette thèse, nous proposons et évaluons une nouvelle approche établie sur la RV, qui lève les limites des expériences réelles pour l'acquisition de données sur le mouvement des foules. Nous appelons cette approche le paradigme « One-Man-Crowd ». Nous proposons tout d'abord de capturer les mouvements de la foule avec un seul utilisateur. En enregistrant les trajectoires passées et les mouvements du corps de l'utilisateur, et en les affichant sur des personnages virtuels, les utilisateurs construisent progressivement le comportement global de la foule. Nous proposons ensuite un nouveau concept de foule contextuelle qui s'appuie sur la simulation de la foule pour atténuer les biais comportementaux des utilisateurs lors de la procédure de capture. Nous mettons en œuvre deux stratégies différentes, à savoir un processus Replace-Record-Replay (3R) et un processus Replace-Record-Replay-Responsive (4R). Nous évaluons et validons l'approche proposée en reproduisant et en comparant au total cinq expériences de foules réelles. Nos résultats suggèrent que le paradigme One-Man-Crowd offre une approche prometteuse pour l'acquisition de données réalistes sur les mouvements de foule dans des environnements virtuels.
|
|
Informatique
/ 10-04-2024
Tucciarone Francesco
Voir le résumé
Voir le résumé
Le climat dépend fortement de l’état global de l’océan. La simulation numérique reste le seul moyen de prévoir le système océan-atmosphère et d’évaluer ses états futurs afin d’établir des prévisions fiables des évolutions météorologiques et climatologiques. Les simulations à grande échelle constituent le principaux outils d’étude de l’océan et de l’atmosphère, dans mesure où les simulations à haute résolution restent confinées à de petits domaines géographiques ou à de courtes périodes d’intégration. L’interdépendance complexe des dynamiques à méso-échelle et sous-méso-échelle est cependant perdue dans les simulations qui ne résolvent pas les échelles inférieures au rayon de déformation de Rossby; celles-ci doivent donc être paramétrées. La plupart des défis associés à la dynamique des fluides (dans toutes ses connotations) découlent de la représentation de ces effets à l’aide d’un schéma de fermeture efficace. Une nouvelle famille d’approches consiste à incorporer des perturbations et des composantes de bruit dans la dynamique. L’objectif est d’enrichir la variabilité et de paramétrer les processus sous-maille, la turbulence, l’incertitude des valeurs limites et de tenir compte des erreurs numériques et de discrétisation, tout en respectant les principes physiques de la dynamique des fluides.
|
|
Automatique, productique et robotique
/ 18-03-2024
Smolentsev Lev
Voir le résumé
Voir le résumé
Cette thèse se situe dans le domaine de l’interaction robotique avec des objets déformables. Elle présente une approche de commande robotique pour la manipulation autonome d'un câble déformable attaché entre 2 robots et soumis à la gravité. Le travail de recherche a porté sur l'élaboration d'une approche d'asservissement visuel qui utilise une caméra RGB-D pour extraire la forme du câble et l'angle de lacet du plan vertical qui le contient. Pour concevoir la commande du système, nous avons proposé d’utiliser, en tant qu’informations visuelles, les coefficients d'une courbe parabolique représentant une approximation de la forme du câble et l'angle de lacet de son plan. Le modèle d'interaction qui relie les variations de ces informations visuelles aux vitesses des extrémités du câble a été dérivé analytiquement. Des résultats expérimentaux ont dans un premier temps été obtenus avec un bras robotique manipulant une extrémité du câble et ont démontré l'efficacité de cette approche d'asservissement visuel pour déformer le câble vers une configuration de forme désirée. Cette approche a ensuite été adaptée à la manipulation robotique aérienne et validée expérimentalement sur un scénario robotique impliquant la saisie et le transport d'un objet par un câble manipulé par deux drones quadrotors dont l’un, qui est équipé d'une caméra RGB-D, est contrôlé par la méthode d’asservissement visuel proposée.
|
|
|<
<< Page précédente
1
2
3
4
5
6
Page suivante >>
>|
|
documents par page
|