Data engineer - h/f
CDI Ramonville-Saint-Agne (Haute-Garonne)
Description de l'offre
La cellule transfo & modélisation est une structure interne d'innovation transverse au sein du groupe CLS, constituée de Data Scientists, de développeurs et de Data Engineers. Son objectif principal est de concevoir des produits pour enrichir et valoriser la donnée dans les solutions CLS et de développer les pratiques data/IA au sein de CLS.
Les Data Engineers travaillent à la fois sur des sujets d'innovation et de production. Dans leur rôle transverse, ils sont amenés à collaborer avec les équipes métier, développement, IT et travailler :
Sur des plateformes de type datalake on-premise ou cloud (AWS),
Sur une diversité grandissante de données (données satellites optiques et radars, météo, données océaniques, trajectoires, télémétrie…) dans un cadre de projet de transformation digitale de l'entreprise,
Pour différents cas d'usage métier (sécurité maritime, pêches durables, surveillance de l'environnement…)
Dans ce cadre, nous cherchons un Data Engineer pour renforcer l'équipe.
Ce que nous attendons de vous :
Comprendre le besoin métier et formuler le problème en tenant compte des données envisagées, de l'infrastructure disponible et des contraintes du projet.
Analyser les approches possibles et explorer des nouvelles technos si nécessaire.
Concevoir et mettre en place des systèmes de données résilients et sécurisés (pub/sub, systèmes temps-réels, API,).
Concevoir et implémenter des pipelines d'ingestion et de processing de données (structurées / non-structurées), à des fréquences variables (batch, micro-batch, temps réel.
Mettre en œuvre des outils de stockage appropriés (base de données, stockage distribué…).
Industrialiser, optimiser les traitements batch ou temps réel.
Collaborer avec les Data Scientists lors de leur mise en œuvre de machine learning sur les plateformes big data.
Participer ponctuellement à des appels d'offre : compréhension du besoin, chiffrage des activités, rédaction de la partie technique des propositions.
Être force de proposition pour améliorer nos pratiques data (collaboration, pratiques de code, standardisation des solutions, …) au sein du Datalab, de la Direction Advanced Tech et de CLS au global.
Contribuer à la transformation digitale sur les futurs sujets autour de la data : datalake, data mesh, data gouvernance,
Participer activement à la vie d'équipe du Datalab (partage d'expérience, veille technologique).
Profil recherché
Ingénieur de formation, vous avez 2 à 3 ans d'expérience en data engineering, big data ou développement autour de la data.
Vous aimez traduire des problématiques métiers complexes en solutions analytiques concrètes, travailler avec les équipes métiers et participer activement à l'amélioration continue des pratiques data.
Vous maîtrisez :
Les langages de programmation (Java, Scala).,
Les outils de traitement des données (Apache Spark, Hadoop, dask)
La manipulation et le traitement des fichiers parquet, iceberg, zarr,
Les principaux outils open source Big data (Hadoop, Hive, Trino, Kudu)
Les outils devops de CI/CD (Git, Docker, Kubernetes, Helm, Terraform)
La connaissance d'AWS, du Machine Learning et une appétence pour le ML engineering est un plus.
Nous souhaitons intégrer à nos équipes des collaborateurs enthousiastes, passionnés et curieux.
L'ouverture d'esprit, l'aisance relationnelle, la flexibilité, l'autonomie et l'esprit d'analyse sont attendus.
Enfin si pour vous l'esprit d'équipe est primordial, que vous êtes force de proposition, et que votre motivation est sans faille, alors n'hésitez plus, et venez nous rejoindre pour participer à l'animation de l'équipe du Datalab de CLS.
À propos de CLS
Au cœur des enjeux de la planète, CLS, Tech4Good company, filiale du CNES et de la CNP, est une société à mission internationale, pionnière dans la fourniture de solutions d'observation et de surveillance de la Terre.
Opérateur historique des balises Argos, CLS, depuis 1986, avec plus de 950 salariés dans 33 pays et un chiffre d'affaires annuel de près de 180 millions d'euros, figure parmi les spécialistes des services satellitaires en utilisant les technologies spatiales les plus avancées, couplées au génie logiciel et à la data-sciences.
Vous souhaitez rejoindre des équipes agiles et dynamiques sur des projets innovants et ambitieux ? Explorer de nouvelles technologies ? Evoluer sur des projets transverses et variés autour des 5 secteurs d'activité de CLS ?
Ceci est possible au sein de la Direction Advanced Tech dont le défi pour soutenir la croissance de CLS est de bâtir un socle solide et partagé au sein du groupe CLS pour l'ensemble de ses systèmes et services actuels et futurs !