Alternance – Machine Learning Engineer / Data scientist (F/H)
CDI Suresnes (Hauts-de-Seine)
Description de l'offre
*
Au sein de la Direction Technique de Direct Assurance, dans l’équipe responsable de la tarification du produit Multirisques Habitation, vous aurez l’opportunité de contribuer à l’innovation en automatisant l’entraînement de modèles grâce à des technologies MLOps de pointe (Databricks, MLFlow, Kedro, etc.).
Au cours de votre alternance, vous participerez à l'ensemble de la chaîne d’optimisation tarifaire lors des déménagements.
Vous serez amené à travailler sur les sujets suivants :
- Automatisation des bases de données : Créer et automatiser les bases requises pour la modélisation ;
- Amélioration du modèle de résiliation : Tester des techniques de Machine Learning pour optimiser la prévision des résiliations de contrats ;
- Optimisation tarifaire : Explorer des méthodes mathématiques pour définir les prix à proposer aux clients ;
- Mise en production : Déployer vos solutions et les tester en conditions réelles avec des A/B tests ;
- Mesure de la dérive : Analyser la performance des modèles en suivant les données collectées dans le temps.
Tout au long de vos missions, la priorité sera d’appliquer des pratiques et des méthodologies de MLOps. Aucune connaissance préalable sur ces sujets n’est requise L’important est d’avoir une appétence pour l’apprentissage.
Vous appliquerez notamment des principes de :
- Qualité du code et des données : Assurer une bonne structuration du code avec Kedro, effectuer des tests et gérer les pipelines avec Git tout en garantissant la qualité des données ;
- Automatisation des processus : Utiliser Databricks pour automatiser les pipelines de données ;
- Traçabilité : Suivre les données et les modèles grâce à MLFlow et au modèle registry.
En résumé, cette opportunité vous permettra d’approfondir à la fois des aspects liés à la data science et à l’ingénierie du Machine Learning
Profil recherché
Qualifications :
Nous recherchons un profil …
· Étudiant(e) Bac+5 en école d'ingénieur ou université, spécialisé(e) en Mathématiques, Statistiques ou Data Science ;
· Avec des capacités à développer en Python avec les bibliothèques classiques de traitement et d'analyse de données (Pandas, Numpy ; Matplotlib/Seaborn, Scikit-Learn).
· Familiarité avec les bonnes pratiques de développement (tests unitaires, Git) ;
· Notions de SQL et compréhension des principes de Machine Learning ;
· Appréciation du travail collaboratif et capacité à produire des livrables rigoureux et de haute qualité.
Des connaissances sur le Framework de développement Kedro seraient un atout, mais ne sont pas obligatoires.
Le poste est basé à Suresnes (92) à proximité de la Défense.