Partitioning of large hyperspectral image data streams

Partitioning of large hyperspectral image data streams
(Partitionnement de grands flux de données d'images hyperspectrales)

Wang, Yuding - (2023-12-15) / Université de Rennes
Partitioning of large hyperspectral image data streams

Accéder au document :

https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Langue : Anglais

Directeur(s) de thèse: Chehdi, Kacem

Discipline : Signal, image, vision

Laboratoire : IETR

Ecole Doctorale : MATISSE

Classification : Sciences de l'ingénieur

Mots-clés : Flux de données, partitionnement non supervisé, estimation, images hyperspectrales, optimisation

Architecture dataflow
Imagerie hyperspectrale

Résumé : Avec le développement de systèmes de prise de décision automatisés et optimisés, le partitionnement de grands flux de données, qui ne dépend pas d'échantillons d'apprentissage, attire de plus en plus l'attention. Dans l'état de l'art, la majorité des méthodes de partitionnement de flux de données sont paramétriques, ce qui nécessite la spécification d'un ou plusieurs paramètres définis par l'utilisateur et/ou du nombre de classes avant le processus de partitionnement. En effet, dans les applications pratiques, obtenir des connaissances a priori sur l'ensemble de données et déterminer les valeurs de paramètres optimales à l'avance est un défi. Par conséquent, notre recherche se concentre sur le développement d'une méthode non supervisée et non paramétrique facile à utiliser par les utilisateurs, bénéficiant du fait qu'elle élimine le besoin de connaissances a priori et supprime la nécessité de régler les paramètres de manière empirique. La méthode développée peut estimer de manière autonome le nombre de classes et partitionner le flux de données. Elle est efficace pour partitionner un flux de données de grandes tailles spatiale et spectrale, en particulier les flux de données hyperspectraux. La méthode proposée a été évaluée sur des bases de données réelles et synthétiques. Selon plusieurs critères d'évaluation objectifs, elle surpasse les cinq méthodes de partitionnement de flux de données comparées (trois méthodes paramétriques non supervisées, une méthode semi-supervisée et une méthode supervisée utilisant l'apprentissage actif).

Abstract : With the development of automated and optimized decision-making systems, large data stream partitioning, which does not rely on training samples, has attracted more and more attention. In the stat-of-the-art, a majority of data stream partitioning methods are parametric which require the specification of one or more user-defined parameters and/or the number of classes before the partitioning process. Indeed, in practical applications, obtaining prior information about the dataset and determining optimal parameter values in advance can be challenging. Therefore, our research focuses on the development of an unsupervised and non-parametric method which is easy to apply by users, benefiting from the fact that it eliminates the need for prior information and obviates the requirement for empirical parameters tuning. The developed method can autonomously estimate the number of classes and partition the data stream. It is efficient to partition large and high spatial and spectral dimensional data streams, especially hyperspectral data streams. Our proposed method was assessed on real-world and synthetic databases. According to several objective evaluation criteria, it outperforms the five compared data stream partitioning methods (three parametric unsupervised methods, one semi-supervised method and one supervised method using active learning).