Description
Nous recrutons un-e Data & Language Analyst pour un stage de 6 mois afin de renforcer notre équipe Data Science.
OUTSCALE, , est un opérateur souverain et durable de l'Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.
Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Experiences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l'obtention de la qualification SecNumCloud.
Vos missions
Au cours de ce stage, vous ferez partie de l'équipe Data Science, en soutenant activement le développement d'ensembles de données de haute qualité pour l'apprentissage automatique (ML/DL) et l'entraînement de modèles d'IA. Vous participerez aux missions suivantes :
Gestion et traitement des données pour les projets d'IA
- Gérer la collecte, l'annotation et la transformation des données afin de garantir la qualité des données d'entrée pour les modèles d'IA
- Qualifier, structurer et améliorer les ensembles de données pour l'entraînement, l'inférence et l'évaluation des modèles d'IA, y compris les applications des LLMs, du NLP et de Computer Vision
- Contribuer à la gestion du cycle de vie des données, de l'ingestion au prétraitement et au stockage
Analyse des données et assurance qualité
- Analyser les erreurs et évaluer la qualité des données afin d'améliorer la cohérence des ensembles de données pour divers projets
- Identifier les biais, les incohérences et les lacunes dans les données d'entraînement et suggérer des améliorations
- Soutenir le perfectionnement des modèles d'IA en analysant les résultats et en proposant des améliorations fondées sur les données
Collaboration avec l'équipe Data Science
- Travailler en étroite collaboration avec les Data Scientists, les ingénieurs ML et les business analystes pour aligner les ensembles de données sur les objectifs de modèles
- Participer aux échanges sur les performances des modèles d'IA, les stratégies d'annotation et le développement des ressources linguistiques
- Développer des lexiques spécifiques à un domaine, des bases de connaissances et de la documentation pour améliorer les applications d'IA
Stack technique
- NLP- tokenization, segmentation, chunking, vectorisation, évaluation (NLTK, embeddings, transformers, F score/Precision/Rappel)
- Python - pandas, numpy, scikit-learn, pytorch (nice to have)
- Linux
- Git
Profil recherché
Votre profil
- Étudiant-e en linguistique, en linguistique informatique, en science des données ou dans un domaine connexe (LEA, NLP, IA, etc.), vous recherchez un stage de fin d'études
- Vous possédez des compétences en matière d'analyse, de structuration, d'annotation et d'évaluation de la qualité des données
- Vous avez un esprit analytique, le souci du détail et une capacité à résoudre des problèmes
- Un intérêt pour l'IA, le NLP ou les LLM est un atout majeur
- Vous avez la capacité à travailler dans un environnement collaboratif et innovant
- Maîtrise du français et de l'anglais (à l'écrit et à l'oral)
Nous vous proposons
- Des technologies et méthodologies de pointe en matière d'intelligence artificielle
- Développer de l'expérience pratique dans des projets d'IA axés sur les données, contribuant directement à des applications du monde réel
- Collaborer avec des équipes pluridisciplinaires dans un environnement stimulant et de haute technologie
- Un parcours d'apprentissage structuré pour améliorer votre expertise en matière d'IA et de gestion des données
Nous rejoindre c'est aussi
- Intégrer une entreprise scientifique au cœur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
- Environnement multiculturel
- Cadre de travail convivial axé sur le bien-être et la santé
- Engagement en faveur de la diversité et de l'inclusion
- Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.
Informations complémentaires
Informations complémentaires
Contrat | : | Stage |
Durée du contrat | : | 6 mois |
Lieu de la mission | : | Hauts-de-Seine Saint-cloud |
Niveau d'étude | : | Bac + 5 et plus : DEA, DESS, mastère, MBA... |
Poste(s) disponible(s) | : | 1 |
Poste de cadre | : |
Suivant Profil
|
Début de la mission | : | 12/04/2025 |
Secteur | : | Informatique, Télécommunications |