Description
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial. Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité. La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont 740 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité...), les femmes et les hommes de Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance. Au sein de Innovation, vous serez intégré(e) dans une équipe de recherche à la pointe de l'innovation dans le domaine de l'IA. Notre équipe met à profit des techniques d'intelligence artificielle pour développer des applications allant de l'optimisation des réseaux mobiles et véhiculaires, à la gouvernance des données, en passant par l'amélioration de l'expérience client. Vous participerez à un projet de recherche portant sur la structuration des connaissances dans des graphe
Votre rôle est d'effectuer une thèse sur l'Intégration et la traçabilité des connaissances dans un système de Q/A basé sur GraphRAG.
Contexte global et problématique
L'essor des agents conversationnels a transformé la manière dont les informations sont recherchées. Des outils comme Le Chat ou ChatGPT ont démontré leur efficacité dans des tâches de recherche d'information. Ils rencontrent des limites lorsqu'il s'agit de mobiliser des connaissances à jour et spécifiques à l'entreprise. Cette lacune génère une demande pour des solutions capables d'exploiter des bases internes à l'entreprise. Les graphes de connaissances d'entreprise (EKG) émergent comme une source stratégique couvrant les domaines de l'entreprise. Ces graphes améliorer la précision et la traçabilité des systèmes de recherche d'information.
Objectif scientifique
La problématique centrale est d'améliorer la robustesse, la précision, la traçabilité et l'autonomie d'un système de recherche d'information basé sur une synergie entre un LLM et un EKG. Cette approche vise à surmonter les limitations des outils d'IA Générative, en exploitant les connaissances spécifiques et à jour de l'entreprise.
Un des défis clés est l'injection équilibrée des connaissances, en évitant le problème d'information " lost in the middle ". Par ailleurs, la confiance des utilisateurs dans le système est un facteur crucial pour son adoption. Il est donc essentiel de concevoir un mode de fonctionnement qui renforce cette confiance tout en incitant les utilisateurs à contribuer à l'enrichissement des graphes de connaissances. Enfin, l'autonomie des agents LLM peut être améliorée par une meilleure compréhension des intentions de l'utilisateur et l'orchestration de modèles spécialisés pour des tâches spécifiques.
Les objectifs de cette thèse sont :
Affiner la collecte des contextes par un agent orchestrateur et explorer de nouvelles méthodes de re-ranking tirant parti du graphe de connaissances ;
Implémenter des mécanismes pour gérer la traçabilité et la transparence des réponses générées via la mise à disposition des sources et définir une boucle vertueuse entre collecte des retours utilisateur, modification du graphe et mise à jour du moteur de recherche d'information ;
Travailler la compréhension de l'intention de l'utilisateur et la définition d'un plan d'actions complexe?;
Concevoir, développer et déployer un prototype de service rendant plus exploitable les données de l'entreprise.
Profil recherché
Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste
Vous possédez des connaissances en Deep Learning et avez déjà mis en oeuvre des algorithmes d'apprentissage.
Vous possédez des compétences en traitement automatique des langues avec un approfondissement sur les grands modèles de langage (e.g. fine-tuning).
Vous maitrisez plusieurs technologies du Web Sémantique et plus particulièrement les langages de représentation de connaissances RDF/RDFS ainsi que le langage d'interrogation SPARQL.
Vous possédez les compétences nécessaires au développement des logiciels et avez une bonne connaissance du langage Python.
Vous disposez d'une bonne capacité rédactionnelle, aussi bien en français qu'en anglais.
Vous savez réaliser des présentations en français et en anglais et savez adapter votre niveau de discours à l'auditoire.
Vous aimez trouver des solutions pour répondre à un besoin et ne craignez pas de vous remettre en question.
Vous êtes capable de mener à bien un sujet et êtes force de proposition.
Vous êtes enthousiaste, autonome et proactif.
Vous avez un bon sens de l'analyse et êtes rigoureux dans l'exécution de votre mission.
Formation demandée (master, diplôme d'ingénieur, doctorat, domaine scientifique et technique ...)
Vous êtes titulaire d'un master professionnel ou recherche ou êtes diplômé(e) d'une école d'ingénieurs en informatique avec, de préférence, une spécialisation dans un ou plusieurs domaines de l'intelligence artificielle.
Expériences souhaitées (stages, ...)
Utilisation d'algorithmes de Deep Learning
Manipulation de grands modèles de langage
Construction et interrogation de graphes de connaissances
Informations complémentaires
Informations complémentaires
Contrat | : | CDD |
Durée du contrat | : | 36 mois |
Lieu de la mission | : | Territoire de Belfort Belfort |
Niveau d'étude | : | Bac + 5 et plus : DEA, DESS, mastère, MBA... |
Expérience | : | Débutant |
Poste(s) disponible(s) | : | 1 |
Poste de cadre | : |
Oui
|
Début de la mission | : | Dès que possible |
Salaire : | : | une couverture santé et prévoyance, des réductions sur les offres et produits d'Orange ainsi que les activités sociales et culturelles proposées par le comité d'entreprise. |
Secteur | : | Direction |