Imprimer |
Timed automata learning from time series (Apprentissage automatique d'automates temporisés à partir de séries temporelles) Cornanguer, Lénaïg - (2023-11-02) / Université de Rennes Timed automata learning from time series
| |||
Langue : Anglais Directeur(s) de thèse: Largouët, Christine; Termier, Alexandre Discipline : Informatique Laboratoire : IRISA Ecole Doctorale : MATISSE Classification : Informatique Mots-clés : apprentissage d’automates, automates temporisés, système à évènements discrets, séries temporelles, discrétisation, détection d’anomalies
| |||
Résumé : Cette thèse explore le développement de nouvelles techniques pour exploiter les données d’observation de système afin d’apprendre automatiquement des modèles de comportement. Nous utilisons le formalisme de l’automate temporisé, un automate fini dont les changements d’état sont déclenchés par des événements et contraints par le temps. Trois enjeux principaux sont abordés : (1) l’apprentissage d’automates temporisés à partir de séquences d’événements; (2) la discrétisation de séries temporelles pour permettre l’apprentissage d’automates temporisés à partir de données numériques; et (3) l’apprentissage d’automates temporisés en interaction à partir de séries temporelles. Tout d’abord, nous présentons TAG, un algorithme d’apprentissage d’automates temporisés. Une experience sur des données synthétiques démontre qu’il atteint un meilleur équilibre entre sur-ajustement et généralisation que les algorithmes de l’état de l’art. Ensuite, nous proposons MOODES, une méthode de discrétisation de séries temporelles basée sur l’optimisation de critères favorables à l’apprentissage d’automates temporisés. TAG et MOODES sont appliqués sur un défi de détection d’anomalies dans les séries temporelles avec une approche basée sur des ensembles d’automates. Enfin, nous présentons une nouvelle approche de discrétisation pour séries temporelles multivariées qui identifie et préserve les synchronisations afin d’apprendre des automates en interaction. Abstract : This thesis explores the development of new techniques for using the observational data of a system to automatically infer behavior models. We adopt the Timed Automata formalism, a finite-state machine in which state changes are triggered by events and are constrained by time. Three main challenges are addressed: (1) learning a Timed Automaton from event sequences; (2) discretizing time series to enable the learning of Timed Automata from numerical data; and (3) learning interacting Timed Automata from time series. First, we introduce TAG, a Timed Automata learning algorithm. Experiment on synthetic data demonstrates that it achieves a better balance between overfitting and generalization than the State-of-the-Art algorithms. Then, we propose MOODES, a discretization method based on optimizing criteria favorable for learning Timed Automata, which produces multiple solutions. TAG and MOODES are applied to a time series anomaly detection challenge where we use ensembles of Timed Automata and provide explanations for the anomalies. Finally, we present discretization approach for multivariate time series that identifies and preserves the synchronizations with the aim of learning interacting automata. |