STAGE Interprétabilité d'algorithmes de clustering de patients

Description

Au sein du département Corporate Strategy & Research, vous intégrerez l'équipe Living Twins for Practitioners, riche de compétences en médecine, biologie, mathématique et informatique, et qui conduit plusieurs projets en oncologie, neurologie et cardiologie.

Dans le cadre de la diversification de nos activités en santé, vous ferez partie de l'équipe « Clinical Decision » et serez responsable de la mise en place de méthodes statistiques ou de Machine Learning permettant :

* D'analyser statistiquement les caractéristiques cliniques des sous-groupes de patients créés par des algorithmes de clustering,
* D'interpréter la construction de ces clusters,
* et de comparer chacun des sous-groupes de patients similaires avec les autres populations,

pour en déduire une carte de connaissance de la maladie étudiée.



Missions

Le but de ce stage sera de mettre en place des procédure d'analyses statistiques par sous-groupes de patients et de comparer des méthodes d'interprétabilité (e.g. explainer tree, feature importance, SHAP, …) permettant d'interpréter la construction des sous-groupes issues d'algorithmes de clustering de patients.

Un exemple d'application pourrait être lié à des pathologies neurologiques dans le cas de maladies rares ou à l'oncologie.

L'enjeu de la création d'une carte de connaissances d'une maladie rare étant très ambitieux, il s'agira de tester les méthodologies implémentées sur des maladies plus fréquentes (comme le cancer) puis tester leur généralisation à des maladies plus rares.

Votre contribution consistera à :

* Effectuer un état de l'art des méthodes d'interprétabilité développés spécifiquement pour l'interprétation des sous-groupes issues d'algorithmes de clustering de patients ;
* Prendre en main la base de données de patients qui sera utilisé lors du stage, la nettoyer et faire des études descriptives des données ;
* Implémenter une ou plusieurs méthodes statistiques ou de Machine Learning pour répondre au problème posé en langage Python;
* Appliquer et comparer les méthodes sur ces données ;
* Présenter ces résultats d'interprétation sous forme résumée.

Profil recherché

Vos qualifications

Etudiant(e) en école d'ingénieur ou Master Universitaire, de niveau Bac+5, vous recherchez un stage.

Compétences techniques souhaitées :

Biostatistiques / Statistiques / Mathématiques appliquées

Machine learning / Deep learning

Languages python, R

Anglais courant

Une connaissance en biologie et/ou en médecine est un plus.

Qualités appréciées pour la bonne démarche de ce stage :

Autonomie, Motivation, Esprit critique, Esprit d'initiative, Bon sens de la communication



Nous rejoindre c'est aussi

Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans.

* Environnement collaboratif et innovant
* Collaboration internationale
* Diversité des technologies, produits et solutions
* Engagement en faveur de la diversité et de l'inclusion

Informations complémentaires

Informations complémentaires
Contrat : Stage
Durée du contrat : 6 mois
Lieu de la mission : Yvelines Vélizy-villacoublay
Niveau d'étude : Bac + 5 et plus : DEA, DESS, mastère, MBA...
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Début de la mission : Dès que possible
Secteur : Informatique, Télécommunications

Partager cette offre

Si cette annonce ne vous correspond pas ? Pensez à vos amis en leur partageant le lien.

Offres Similaires