Imprimer |
Representation of uncertainty and imprecision between clusters with belief functions (Représentation de l'incertitude et de l'imprécision entre les clusters avec des fonctions de croyance) Zhang, Zuowei - (2022-01-18) / Universite de Rennes 1, Northwestern Polytechnical University (Chine) Representation of uncertainty and imprecision between clusters with belief functions
| |||
Langue : Anglais Directeur(s) de thèse: Martin, Arnaud; Liu, Zhunga Discipline : Informatique Laboratoire : IRISA Ecole Doctorale : MATHSTIC Classification : Informatique Mots-clés : Fonctions de croyance, clustering crédibiliste, incertitude, imprécision
| |||
Résumé : Le clustering crédibiliste fondé sur la théorie des fonctions de croyance est devenu un sujet important de la fouille de données en raison de sa capacité à caractériser l'incertitude et l'imprécision entre les clusters. Cependant, il existe encore des problèmes tels que l'ambiguïté des concepts de base, la complexité de calcul élevée et l'incapacité à détecter efficacement les clusters déséquilibrés et arbitraires. Cette thèse est consacrée à la résolution des problèmes ci-dessus et propose des solutions correspondantes, qui comprennent quatre parties. Tout d'abord, nous passons en revue de manière exhaustive les algorithmes de clustering crédibiliste existants et nous donnons les concepts et définitions associés, en détaillant en quoi le clustering crédibiliste peut caractériser l'incertitude et l'imprécision entre les clusters. Deuxièmement, nous proposons un algorithme de clustering dynamique qui peut réduire efficacement la complexité de calcul des algorithmes existants pour étendre les applications. Troisièmement, nous proposons un algorithme de regroupement par décalage de croyance pour caractériser l'incertitude et l'imprécision entre les grappes déséquilibrées. Quatrièmement, nous proposons un algorithme de convergence crédibiliste fondé sur les pics de densité qui généralise la détection de clusters de forme, de taille et de structure spatiale arbitraires. Des données artificielles et réelles ont permis de vérifier l'efficacité des algorithmes proposés. Enfin, nous discutons également de quelques recherches potentielles à l’issue de cette thèse. Abstract : Evidential clustering based on the theory of belief functions has become one of the topics of machine learning due to its ability to characterize the uncertainty and imprecision between clusters. However, there are still problems such as ambiguity of basic concepts, high computational complexity, and inability to detect imbalanced and arbitrary clusters effectively. This thesis is devoted to addressing the above problems and proposes corresponding solutions, which include four parts. First, we comprehensively survey existing evidential clustering algorithms and give related concepts and definitions, detailing why evidential clustering can characterize the uncertainty and imprecision between clusters. Second, we propose a dynamic evidential clustering algorithm that can effectively reduce the computational complexity of existing algorithms to extend the applications. Third, we propose a belief shift clustering algorithm to characterize the uncertainty and imprecision between imbalanced clusters. Fourth, we propose a density peaks-based evidential convergence algorithm that generalizes the detection of clusters of arbitrary shape, size, and spatial structure. Artificial and real data have verified the effectiveness of the proposed algorithms. Finally, we also discuss some potential research based on this thesis. |