Description
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l'innovation et de l'expertise sur les services du réseau domestique et des équipements connectés. Vous ferez partie d'un écosystème de recherche autour de l'intelligence artificielle et des jumeaux numériques. Vous côtoierez d'autres chercheurs et doctorants du domaine, les équipes opérationnelles travaillant sur les produits et services du réseau domestique et des équipements connectés.
Votre rôle est d'effectuer un travail de thèse sur : " Détections et explications auto-supervisées d'anomalies dans les données temporelles "
Contexte global et problématique du sujet
Orange opère un grand nombre d'équipements connectés, du coeur de réseau jusqu'au LAN des clients. Le nombre de pannes et d'attaques pouvant survenir est très important, et il est de plus en plus difficile de comprendre ces problèmes, qui ont un coût important pour les services client.
Jusqu'à présent, les travaux de l'état de l'art et au sein d'Orange [1, 2, 3] se sont concentrés sur la détection des anomalies dans des données temporelles. Cette détection consiste en un résultat binaire - anomalie ou non - et ne porte aucune information sur l'origine de la détection.
Les solutions explorées ne permettent pas d'agir sur les anomalies détectées, et un expert est toujours nécessaire pour tenter de trouver des corrélations entre les anomalies et faire des hypothèses sur les origines et procédures correctives.
Plus récemment, les avancées importantes sur les grands modèles de langages (LLM) promettent des perspectives intéressantes sur les problèmes d'interprétabilité. Avec un modèle de caractérisation des anomalies, il serait possible de mettre en relation les anomalies détectées et des problèmes connus.
Objectif scientifique - résultats et verrous à lever
L'objectif de cette thèse est de proposer des approches deep learning auto-supervisées de détection et de caractérisation d'anomalies dans les données temporelles. Ces caractéristiques devront être exploitées pour permettre une identification de l'anomalie détectée, en exploitant par exemple des bases de connaissance métier. Il s'agit de proposer une solution de détection et d'interprétation d'anomalies de bout-en-bout sans intervention humaine.
Verrous scientifiques :
Données et anomalies hétérogènes
Présence incertaine d'anomalies dans les données
Rapprochement difficile entre caractérisation d'une anomalie et connaissance métier
Anomalies potentiellement inconnues
Résultats attendus :
Modèle de détection d'anomalies auto-supervisé robuste qui caractérise les écarts entre la séquence observée et la séquence normale attendue
Approche basée LLM+RAG pour mettre en relation la caractérisation de l'anomalie détectée avec des connaissances métiers
Évaluations expérimentales sur données publiques et d'Orange
Publication d'articles scientifiques, de brevets, et manuscrit de thèse
Profil recherché
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
Vous êtes diplômé d'une école d'ingénieur et/ou d'un Master 2 Recherche dans le domaine de l'informatique et/ou des mathématiques appliquées.
Vous avez une très bonne connaissance théorique et pratique des techniques d'apprentissage automatique (machine learning, deep learning).
Une expérience des grands modèles de langages (LLM) et techniques associées (Chain of thought, RAG, GraphRAG, etc.) est un atout important.
Une expérience des approches de détection d'anomalies statistiques (Isolation Forest, LOF, etc.) est un plus.
Une expérience du web sémantique, de l'internet des objets, des environnements connectés en général est un plus.
Vous avez une expérience significative de développement en Python, avec des frameworks de machine learning courants (PyTorch, scikit-learn), et du versioning avec Git.
Vous êtes méthodique, autonome, curieux et réactif. Capacités à travailler en équipe et à partager ses connaissances à l'écrit comme à l'oral.
Vous souhaitez mener une carrière dans la recherche et l'innovation.
Vous maîtrisez le français et l'anglais (lu, écrit, parlé).
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique ...)
Vous êtes diplômé d'une école d'ingénieur et/ou d'un Master 2 recherche en informatique et/ou mathématiques appliquées.
Domaines de recherche : machine learning, deep learning, anomaly detection.
Expériences souhaitées (stages, ...)
Stage orienté recherche dans un environnement académique ou industriel.
Une expérience de publications scientifiques (revues et conférences) est un plus.
Références
1. Najari et al., RADON: Robust Autoencoder for Unsupervised Anomaly Detection, SIN 2021
2. Najari et al., Robust Variational Autoencoders and Normalizing Flows for Unsupervised Network Anomaly Detection, AINA 2022
3. Darban et al., Deep Learning for Time Series Anomaly Detection: A Survey, ACM Computing Surveys 2025
Informations complémentaires
Informations complémentaires
Contrat | : | CDD |
Durée du contrat | : | 36 mois |
Lieu de la mission | : | Isère Meylan |
Niveau d'étude | : | Bac + 5 et plus : DEA, DESS, mastère, MBA... |
Expérience | : | Débutant |
Poste(s) disponible(s) | : | 1 |
Poste de cadre | : |
Oui
|
Début de la mission | : | Dès que possible |
Salaire : | : | Prestations comité social d entreprise, restaurant d entreprise, participation frais de transport |
Secteur | : | Direction |