Les offres de “TotalEnergies”

Il y a 8 joursTotalEnergies

STAGE - Ingénieur Machine Learning sur NLP H/F

  • Stage
  • Entre 4 et 6 mois
  • Courbevoie (Hauts-de-Seine)

Description de l'offre

In the context of legacy data extraction project for subject matter experts, the goal of the project is to build models to extract data from reports and test different LLM and VLM models to perform OCR and extract information from various kind of structures in the reports.

With the rise of LLMs in the Document AI landscape, it is important to benchmark different LLM before using it for production.

Dans le cadre du projet d'extraction de données à partir de rapports, l'objectif du projet est de créer des modèles pour extraire des données à partir de fichiers PDF, Word, Texte et de tester différents modèles LLM et VLM pour effectuer la tâche OCR. L'étape suivante consistera à extraire des informations à partir de divers types de structures dans les rapports (tableaux, graphiques).

Avec l'évolution des LLM dans le contexte de l'IA documentaire, il est important de comparer différents modèles avant de les utiliser pour la production.

As a Machine Learning Engineer / Data Scientist specialized in LLM/NLP M/F trainee, the objective of the internship would be to investigate the state-of-the-art large language models and visual language models suitable to perform OCR and extract relevant information from the PDFs using open-source models.

An ideal scenario would be to test it on internal and external datasets for benchmarking several models and report the findings in a scientific publication at the end of the internship.

You will evolve within a team of experienced professionals and with a tutor-coach, the reference for your future profession. Individualized support will help you develop your autonomy and lead you to your diploma!

En tant que stagiaire Ingénieur Machine Learning / Data Scientist spécialisé sur NLP H/F, l'objectif du stage serait d'étudier l'état d'avancement des grands modèles de langage (LLM) et des modèles de langage visuel (VLM) adaptés pour effectuer de l'OCR. Vous serez amené à extraire des informations pertinentes à partir de PDF en utilisant des modèles open source, dans le but de conserver une technologie de pointe. Un scénario idéal serait de le tester sur des bases de données internes et externes pour comparer plusieurs modèles et rapporter les résultats dans une publication scientifique à la fin du stage.

Vous évoluerez au sein d'une équipe de professionnels confirmés et auprès d'un tuteur-coach, le référent de votre futur métier. Un accompagnement individualisé vous permettra de favoriser votre autonomie et de vous mener à votre diplôme !

Profil recherché

Actuellement en école d'ingénieur ou en Master dans le domaine de l'informatique / technologie, vous recherchez un stage de fin d'étude d'une durée de 6 mois à partir d'avril 2025 ?

Lors de vos études, vous avez développé vos connaissances des NLP et LLM, ainsi que votre maitrise du Machine Learning. Vous avez des connaissances des IA génératives telles qu'Open IA Mistral, Deepseek ou Anthropic ainsi que de Linux ou NLKT. ? Vous maitrisez la programmation et Python ainsi que ses bibliothèques (Github, HuggingFace, Tranformers) ?

During your studies, you have developed your knowledge of NLP and LLM, as well as your mastery of Machine Learning. You are familiar with generative AIs such as Open AI Mistral, Deepseek, or Anthropic, as well as Linux or NLKT. You are proficient in programming and Python, along with its libraries (Github, HuggingFace, Transformers).

You are comfortable with office tools and familiar with the Office suite? You will notably use Excel, Word, and PowerPoint.

Autonomy, rigor, and team spirit are integral parts of your qualities? You know how to take initiatives? Having good writing skills and a professional command of French will be essential for your position.

So don't wait any longer, apply to join our team!.

À propos de TotalEnergies

TotalEnergies is a global multi-energy production and supply company: oil and biofuels, natural gas and green gas, renewables and electricity. Its 105,000 employees are committed to making energy ever more affordable, clean, reliable and accessible to as many people as possible. Present in more than 130 countries, TotalEnergies places sustainable development in all its dimensions at the heart of its projects and operations to contribute to the well-being of populations.

TotalEnergies est une compagnie multi-énergies mondiale de production et de fourniture d'énergies : pétrole et biocarburants, gaz naturel et gaz verts, renouvelables et électricité. Ses 105 000 collaborateurs s'engagent pour une énergie toujours plus abordable, propre, fiable et accessible au plus grand nombre. Présent dans plus de 130 pays, TotalEnergies inscrit le développement durable dans toutes ses dimensions au cœur de ses projets et opérations pour contribuer au bien-être des populations.

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements