STAGE - Construction de jeux de données de chimie par LLM (H/F)

Description

BIOVIA propose une large gamme de produits et services destinés aux scientifiques, en les aidant à résoudre des problèmes quotidiens ainsi que des questions de recherche fondamentales.

Le produit Materials Studio permet au chercheur en sciences des matériaux de lever les verrous technologiques auxquels il est confronté grâce à la simulation. Nos solutions offrent la possibilité d'une simulation multi-échelle des matériaux allant de la structure électronique à la microstructure de matériaux souples tels que des mélanges de polymères. Materials Studio est développé dans nos bureaux de Cambridge, au Royaume-Uni, par une équipe de scientifiques, dont beaucoup sont reconnus comme des experts dans des domaines tels que la mécanique quantique, la mécanique statistique et la science des polymères.

Ce stage sera effectué en France à Vélizy en collaboration avec notre équipe AI en science des matériaux basée à Cambridge au Royaume-Uni, dans un environnement constitué d'experts reconnus internationalement.



Vos missions



Les grands modèles de langage (LLM) offrent une solution potentielle. Pré-entraînés sur de nombreux jeux de données, y compris la littérature scientifique, les LLM apprennent les nuances du langage naturel, de la syntaxe, de la grammaire et du vocabulaire. Le réglage fin de ces modèles leur permet d'extraire des données spécifiques des documents et de les assembler dans un format plus utile pour les tâches en aval d'analyses de données. Les LLMs, associés à des API unifiées, peuvent contribuer à rationaliser considérablement le processus d'assemblage, permettant ainsi d'assembler efficacement et rapidement de grands ensembles de données à partir de publications brutes.

En travaillant avec notre équipe Materials AI à Cambridge, au Royaume-Uni, vous contribuerez :

- à la création d'un outil convivial pour extraire des données fiables à partir de publications scientifiques liées à des bases de données publiques

- aux jeux de données que vous assemblerez, ils seront soigneusement vérifiés et validés, puis utilisés pour construire des modèles d'apprentissage automatiques par Machine Learning pour des applications durables dans les domaines de la chimie et des matériaux.

Profil recherché

Vos qualifications



Etudiant(e) préparant un diplôme de niveau BAC+5, école d'ingénieur ou master universitaire.

- Le candidat aura une solide formation en chimie ou en science des matériaux, de solides compétences en informatique.

- La connaissance de Python ou d'autres langages de script serait un avantage.

- Avec les échanges constants avec l'équipe basée à Cambridge, une bonne maîtrise de l'anglais est attendue.

- Le candidat devra faire preuve de motivation et de curiosité

- Capacité à travailler de manière indépendante



Type de contrat : Stage conventionné seulement





Nous rejoindre c'est aussi



Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans.

Principaux avantages et bénéfices :

- Environnement multiculturel

- Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie…)

- Engagement en faveur de la diversité et de l'inclusion

- Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc

Informations complémentaires

Informations complémentaires
Contrat : Stage
Durée du contrat : 6 mois
Lieu de la mission : Yvelines Vélizy-villacoublay
Niveau d'étude : Bac + 5 et plus : DEA, DESS, mastère, MBA...
Poste(s) disponible(s) : 1
Poste de cadre : Suivant Profil
Début de la mission : Dès que possible
Secteur : Informatique, Télécommunications

Partager cette offre

Si cette annonce ne vous correspond pas ? Pensez à vos amis en leur partageant le lien.

Offres Similaires