Dynamic visual saliency in image sequences

Imprimer

Dynamic visual saliency in image sequences
(Saillance visuelle dynamique dans des séquences d'images)

Maczyta, Léo - (2020-11-25) / Universite de Rennes 1
Dynamic visual saliency in image sequences

Accéder au document :

https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Langue : Anglais

Directeur(s) de thèse: Bouthémy, Patrick; Le Meur, Olivier

Discipline : Signal, image, vision

Laboratoire : INRIA-RENNES

Ecole Doctorale : MATHSTIC

Classification : Informatique, Sciences de l'ingénieur

Mots-clés : Saillance du mouvement, Analyse de vidéos, Réseaux de neurones profonds, Inpainting du flot optique, Analyse de trajectoires

Saillance visuelle
Réseaux neuronaux (informatique)

Résumé : Les travaux de la thèse portent sur l'estimation de la saillance du mouvement dans des séquences d'images. Dans une première partie, nous avons traité un sujet très peu abordé: la détection des images présentant un mouvement saillant. Pour cela, nous nous appuyons sur un réseau de neurones convolutif et sur la compensation du mouvement de la caméra. Dans une seconde partie, nous avons conçu une méthode originale d'estimation de cartes de saillance du mouvement. Cette méthode ne requiert pas d'apprentissage. L'indice de saillance est obtenu par une étape d'inpainting du flot optique, suivie d'une comparaison avec le flot initial. Dans un troisième temps, nous nous sommes intéressés à l'estimation de la saillance de trajectoires pour appréhender une saillance progressive. Nous construisons une méthode faiblement supervisée s'appuyant sur un réseau auto-encodeur récurrent, qui représente chaque trajectoire avec un code latent. Toutes ces méthodes ont été validées sur des données de vidéo réelles.

Abstract : Our thesis research is concerned with the estimation of motion saliency in image sequences. First, we have defined an original method to detect frames in which a salient motion is present. For this, we propose a framework relying on a deep neural network, and on the compensation of the dominant camera motion. Second, we have designed a method for estimating motion saliency maps. This method requires no learning. The motion saliency cue is obtained by an optical flow inpainting step, followed by a comparison with the initial flow. Third, we consider the problem of trajectory saliency estimation to handle progressive saliency over time. We have built a weakly supervised framework based on a recurrent auto-encoder that represents trajectories with latent codes. Performance of the three methods was experimentally assessed on real video datasets.