Imprimer
Energy optimization of wireless IoT communications with reinforcement learning
(Optimisation énergétique des communications IoT sans fil à l’aide d’apprentissage par renforcement)

Courjault, Jules - (2024-12-11) / Université de Rennes
Energy optimization of wireless IoT communications with reinforcement learning

Accéder au document : https://ged.univ-rennes1.fr/nuxeo/site/esupversion...

Langue : Anglais

Directeur(s) de thèse:  Berder, Olivier

Discipline : Télécommunications

Laboratoire :  IRISA

Ecole Doctorale : MATISSE

Classification : Informatique

Mots-clés : Apprentissage par renforcement, Simulation, Réseaux sans fils, Optimisation, Evaluation des performances, Consommation énergétique
Apprentissage par renforcement (intelligence artificielle)
Internet des objets
Systèmes de communication sans fil  - Économies d'énergie


Résumé : L’augmentation du nombre d’objets connectés dans les réseaux constituant l’Internet des objets engendre une saturation du spectre, pouvant réduire la qualité des transmissions sans fil. Afin d’optimiser les communications, des algorithmes d’adaptation dynamique sont utilisés, tels que l’ADR dans les réseaux LoRaWAN. Cette thèse vise a concevoir des mécanismes d’adaptation plus performants basés sur l’intelligence artificielle. Dans un premier temps, les performances théoriques des communications LoRa sont étudiées dans différents types de canaux, en essayant à la fois de développer une approche la plus générique possible et d’inclure des contraintes industrielles comme le bruit impulsif. Afin de pouvoir simuler un réseau LoRa avec des nœuds utilisant des techniques d’apprentissage par renforcement (RL) pour l’adaptation de paramètres, le simulateur J-LoRaNeS a été développé. Le langage Julia, qui a été utilisé pour le développement, permet un excellent compromis entre rapidité d’exécution et prototypage. Le simulateur a permis de mettre en évidence des lacunes des algorithmes actuels d’adaptation dynamique de débit basés sur le RL, ce qui a mené à la proposition d’un algorithme à retour d’information groupé.

Abstract : The increasing number of connected devices in Internet of Things networks is leading to spectrum saturation, which reduces the quality of wireless transmissions. To optimize these communications, adaptive algorithms such as ADR are used in LoRaWAN networks. This thesis aims to design more efficient adaptation mechanisms based on artificial intelligence. First, the theoretical performance of LoRa communications is studied for different channels, with efforts to both develop the most generic approach possible and to include industrial constraints such as impulsive noise. In order to simulate a LoRa network where nodes use reinforcement learning techniques for parameter adaptation, the J-LoRaNeS simulator was developed. The Julia language was used for the development, providing an excellent trade-off between fast execution time and prototyping. The simulator highlighted flaws in RL-based adaptive mechanisms caused by duty-cycle limitations, leading to the proposal of an algorithm with grouped feedback to address this issue.