Imprimer |
Partitionnement non supervisé de données de grandes dimensions spatiale et spectrale pour l'aide à la décision (Unsupervised partitioning of large spatial and spectral data for decision making) Alameddine, Jihan - (2022-11-15) / Universite de Rennes 1 - Partitionnement non supervisé de données de grandes dimensions spatiale et spectrale pour l'aide à la décision
| |||
Langue : Français Directeur(s) de thèse: Chehdi, Kacem Discipline : Signal, image, vision Laboratoire : IETR Ecole Doctorale : MATHSTIC Classification : Sciences de l'ingénieur Mots-clés : partitionnement non supervisé, données de grande taille, images hyperspectrales, aide à la décision, validation, sélection autonome d’échantillons d’apprentissage
| |||
Résumé : Le partitionnement d'un ensemble de données de grande taille, où le nombre de classes, d'échantillons d'apprentissage et d'autres connaissances a priori ne sont pas disponibles, pose un défi considérable. Ainsi, la conception de méthodes de partitionnement fiables, où toutes les décisions sont prises uniquement sur la base du tableau de données croisant objets/attributs est un problème complexe. Pour apporter une solution à ce problème, nous nous intéressons dans la cadre de cette thèse au développement de méthodes de partitionnement non supervisées et non paramétriques adaptées aux données de grande taille quel que soit le domaine applicatif. La première partie consacrée aux travaux de l’état de l’art présente d’abord les principaux critères d’évaluation d’une partition et donne ensuite une synthèse des principales méthodes de partitionnement mettant en évidence leurs avantages et leurs limites. La seconde partie présente les trois approches de partitionnement non supervisées développées. Pour confirmer leur caractère général, elles ont été appliquées à trois domaines : l’environnement, la reconnaissance des visages avec expressions et la médecine, avec des données acquises par des capteurs différents. Les évaluations montrent le succès des méthodes développées au vue de la pertinence des résultats. En effet, sans aucune intervention de l'utilisateur, les performances sont meilleures que celles des méthodes semi-supervisées et non supervisées les plus efficaces de l’état de l’art. Abstract : Partitioning a large-size dataset, where the number of classes, training samples, and other a priori knowledge are not available, poses a considerable challenge. Thus, designing reliable partitioning methods, where all decisions are made based on the objects/attributes cross data table only, is a complex problem. In order to address this problem, this thesis focuses on the development of unsupervised and non-parametric partitioning methods. Moreover, they are adapted to large-size data whatever the application domain. The first part dedicated to the state-of-the-art work first presents the main criteria for evaluating a partition and then gives a synthesis of the main partitioning methods highlighting their advantages and their limitations. The second part presents the three unsupervised partitioning approaches developed. To confirm their general character, they were applied to three domains: environment, face recognition with expressions and medicine; with data acquired by different sensors. The evaluations show the success of the developed methods in view of the relevance of the results. Indeed, without any user intervention, the performances are better than the most efficient semi-supervised and unsupervised methods of the state-of-the-art. |