Web-based data driven network monitoring: from performance estimation to anomaly detection (Surveillance du réseau basée sur les données Web : de l'estimation de performance à la détection d'anomalies) Taibi, Imane - (2022-09-19) / Universite de Rennes 1 Web-based data driven network monitoring: from performance estimation to anomaly detection
| |||
Langue : Anglais Directeur(s) de thèse: Rubino, Gerardo; Barakat, Chadi Discipline : Informatique Laboratoire : INRIA-RENNES Ecole Doctorale : MATHSTIC Classification : Informatique Mots-clés : Web, mesures passives, surveillance du réseau, détection d'anomalies, CNN
| |||
Résumé : L’objectif de cette thèse est de tirer parti des mesures passives librement disponibles dans le navigateur et des techniques d’apprentissage profond pour inférer la performance du réseau et détecter les anomalies. Nous commençons par déduire les principales propriétés du réseau sous-jacent à partir de mesures de performance Web, en se basant sur des mesures passives obtenues à partir du navigateur. Nous utilisons le Machine Learning pour calibrer les algorithmes qui permettent une telle inférence. En comparant des algorithmes du deep learning à des algorithmes ML classiques comme Random Forest, nous soulignons la faisabilité de la tâche, mais aussi sa complexité, d’où le besoin d’algorithmes d’apprentissage profond sophistiqués tels que les réseaux de neurones convolutionnels (CNN). Ensuite, nous étudions et examinons l’impact de la complexité du Web sur l’estimation de deux paramètres spécifiques, le délai et la bande passante de téléchargement. De plus, nous proposons un framework intégré pour comparer notre approche avec les solutions de surveillance web existantes. Plus tard, nous proposons un système de surveillance réseau original basé sur des modèles de mélanges gaussiens bayésiens (BGMM) couplés à un algorithme pour détecter en temps réel l’apparition d’anomalies. Abstract : The goal of this thesis is to leverage passive measurements freely available in the browser and deep learning techniques to infer network performance and detect anomalies. We start by inferring the main properties of the underlying Network from web performance metrics based on passive measurements obtained from within the browser. We use machine learning to calibrate algorithms that allow such inference. By comparing deep learning algorithms to classical ML algorithms like Random Forest, we highlight the feasibility of the task but also its complexity hence the need for sophisticated deep learning algorithms such as convolutional neural networks (CNN). Then we study and examine the impact of web complexity on estimating two specific metrics, delay and download bandwidth. Moreover, we propose an integrated framework to compare our approach with existing web-based monitoring solutions. Later, we propose an original network monitoring framework based on Bayesian Gaussian Mixture Models (BGMM) coupled with an algorithm to detect in real-time the occurrence of anomalies. |