Apprentissage dans les Systèmes IoT avec Pénurie de Données

Superviseur :
Essaid Sabir
Domaine(s) :
- Apprentissage machine
- Internet des Objets
- Science des données

But:

Utiliser des techniques d’augmentation de données (Few-Shot Learning, Active Learning, Transfer Learning, etc.) pour remédier au problème de pénurie.

Intérêt :

L’étudiant aura l’opportunité d’approfondir ses connaissances en IA et apprentissage machine.

Description :

Nous souhaitons étudier et implémenter des techniques d’augmentation de données en cas de pénurie de données (Small Data). L’idée consiste à utiliser interactivement des données fraîches ou utiliser un modèle pré-entrainé par d’autres agents, dans le but de booster l’apprentissage et réaliser des tâches de prédiction assez précises. L’étudiant commencera par un état de l’art consistant en la lecture et l’analyse de quelques références majeures en techniques d’augmentation de données [1, 2, 3]. Ensuite, il devra mettre en pratique ses connaissances nouvellement acquises pour résoudre un problème spécifique en se basant sur des données originales telles [4] et [5].

À la fin de ce projet, l’étudiant fournira un rapport écrit et une présentation pré-enregistrée. L’étudiant sera aussi encouragé à publier librement son rapport et sa présentation en ligne.

Les compétences requises pour réaliser ce projet :

Compétences générales

Modélisation mathématique; Apprentissage machine; Réseaux informatiques.
Une maitrise de l’anglais est essentielle pour mener à bien ce projet.

Compétences spécifiques

Une connaissance des bases de la science des données et de ses outils est requise.
Le projet pourrait se faire avec Python ou tout autre langage orientée données.

Compétences professionnelles

Communication écrite et orale en français.

Références bibliographiques :

Cao, W. Bu, S. Huang, M. Zhang, I. W. Tsang, Y.S. Ong, and J.T. Kwok, « A Survey of Learning on Small Data: Generalization, Optimization, and Challenge ». arxiv.org/pdf/2207.14443.pdf
Xu, X. Ji, M. Li and W. Lu, « Small data machine learning in materials science ». npj Computational Materials volume 9, Article number: 42 (2023)
Fan and J. Huang, « Federated Few-Shot Learning with Adversarial Learning, » 2021 19th International Symposium on Modeling and Optimization in Mobile, Ad hoc, and Wireless Networks (WiOpt), Philadelphia, PA, USA, 2021, pp. 1-8
Deng, ‘‘The MNIST database of handwritten digit images for machine learning research,’’ IEEE Signal Process. Mag., vol. 29, no. 6, pp. 141–142, Nov. 2012.
Weyand, A. Araujo, B. Cao, J. Sim, « Google Landmarks Dataset v2 – A Large-Scale Benchmark for Instance-Level Recognition and Retrieval. » CoRR abs/2004.01804. 2020.