Apprentissage machine et réseaux de convolution interprétables pour le débruitage supervisé et non-supervisé d'images : application à l'imagerie satellitaire

Apprentissage machine et réseaux de convolution interprétables pour le débruitage supervisé et non-supervisé d'images : application à l'imagerie satellitaire
(Machine learning and interpretable convolutional networks for supervised and unsupervised image denoising with application to satellite imagery)

Herbreteau, Sébastien - (2023-12-05) / Université de Rennes - Apprentissage machine et réseaux de convolution interprétables pour le débruitage supervisé et non-supervisé d'images : application à l'imagerie satellitaire

Accéder au document :

https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Langue : Anglais

Directeur(s) de thèse: Kervrann, Charles; Papadakis, Nicolas

Discipline : Signal, image, vision

Laboratoire : INRIA-RENNES

Ecole Doctorale : MATISSE

Classification : Sciences de l'ingénieur

Mots-clés : Débruitage d'images, Analyse des réseaux de neurones, Equivariance, Méthodes non-locales

Apprentissage automatique
Réseaux neuronaux (informatique)
Traitement d'images -- Techniques numériques
Imagerie satellitaire

Résumé : La première partie de cette thèse est consacrée à la compréhension, l'analyse et la conception de réseaux de neurones supervisés dans le contexte du débruitage d'images. Notre premier travail s'appuie sur le débruiteur traditionnel DCT et le revisite avec une dose d'apprentissage, tout en conservant l'intuition originale. Le CNN à deux couches qui en résulte s'appuie sur une transformation interprétable basée sur les données, ce qui améliore considérablement les performances. En parallèle, nous étudions l'importance de l'équivariance à la normalisation dans le débruitage et proposons des modifications architecturales pour les CNNs existants afin de garantir cette propriété sans perte de performance, tout en les rendant également plus robustes aux changements de niveaux de bruit. La deuxième partie traite de l'apprentissage non supervisé pour le débruitage d'images. Nous proposons un cadre général d'estimation paramétrique basé sur la minimisation du risque quadratique qui permet de réinterpréter et de réconcilier plusieurs méthodes non-locales, y compris BM3D. Grâce à ce paradigme, nous construisons NL-Ridge, un nouveau débruiteur qui exploite les combinaisons linéaires de patchs brutées. Puis, en étendant sa formulation via une technique de chaînage reposant sur l'exploitation d'images pilotes de plus en plus raffinées, un algorithme à plusieurs étapes est proposé. Nous montrons que ce dernier se compare favorablement aux meilleures méthodes non supervisées.

Abstract : The first part of this thesis is dedicated to the understanding, analysis and design of supervised neural networks in the context of image denoising. Our first work builds on the traditional DCT denoiser and revisits it with a dose of machine learning, while keeping the original intuition. The resulting shallow CNN relies on an interpretable data-driven transform which significantly improves performance. In parallel, we study the importance of equivariance to normalization in denoising and propose some architectural modifications to existing CNNs to guarantee this property without loss of performance, making them more robust to outliers. The second part deals with unsupervised learning for image denoising. We propose a general parametric estimation framework based on quadratic risk minimization that enables to reinterpret and reconcile several state-of-the-art non-local methods, including BM3D. Within this paradigm, we build NL-Ridge, a novel denoiser which leverages linear combinations of noisy patches. Then, by extending its formulation via a chaining technique relying on the exploitation of more and more refined pilot images, a multi-step algorithm is derived. We show that this latter compares favorably with the very best unsupervised methods.