STAGE - Développement et amélioration de la recherche par IA (RAG) dans un corpus documentaire F/H (2024-121036)
Stage Grenoble (Isère) Développement informatique
Description de l'offre
Description de l'offre
Cette année, soyez l’un des 6500 stagiaires à rejoindre le Groupe EDF !
90% des étudiants recommandent l’entreprise à l’issue de leur alternance ou de leur stage.
Découvrez en images nos orientations et nos valeurs sur la chaîne YouTube EDF : https://www.youtube.com/user/EDFCommunitymanager
Votre environnement
Vous intègrerez le service DTMP (Développement Technologies, Méthodes et Produits) de l'unité DTG. Sa mission est de promouvoir, impulser et organiser l’innovation à DTG, en collaboration avec les 4 départements métiers, le service DESIR (Développement et Exploitation de Solutions Informatiques et Réseaux) et la cellule vente externe de la DIRDEV (Direction Développement).
Ses activités incluent :
· Coordination de la préparation de l’avenir de DTG, en assurant le maillage interne et externe au Groupe (CIH, R&D, pôles de compétitivité), l’exploration de nouvelles technologies et un appui transverse sur le matériel de mesure et la métrologie.
· Accompagnement méthodologique des projets de développement (facilitation, collège d’accélération, incubateur).
· Apport d’expertise technologique (data, drone, métrologie, SIG) en soutien aux projets de développement.
· Contribution à la production de nouvelles solutions technologiques intégrées, industrialisées et commercialisables.
Dans ce contexte, notre unité EDF DTG propose pour son service DTMP un stage sur le poste développement et amélioration de la recherche par IA (RAG) dans un corpus documentaire F/H.
Votre mission
Au sein du LabData, ce stage a pour objectif de développer méthodes avancées de recherche dans de vastes corpus documentaires, pas uniquement textuels mais contenant aussi des images (exemple : graphiques, plans…) et du texte structuré (tableaux, JSON…), en faisant appel aux méthodes d’IA les plus récentes.
prendre en main l’application existante de RAG (Génération Augmentée par la Recherche) basé sur l’extraction de texte, son filtrage et la création de bases de données vectorielles
proposer des améliorations de ce processus et finalement d’évaluer quantitativement la recherche.
développer une nouvelle méthode permettant d’utiliser directement les données sous format image grâce à des embeddings multimodaux, une méthode potentiellement à la fois plus riche et plus simple que l’extraction de texte.
Le stagiaire sera amené à utiliser les moyens informatiques du LabData ainsi que la plateforme IA du groupe EDF permettant de faire appel à des LLM par API.
Le stage se conclura par une note de synthèse, la livraison d’un modèle adapté à l’entreprise, et une preuve de concept avec une application prototype sur un cas d’usage métier.
Découvrez également les activités de la Division Technique Générale d’EDF sur la chaine YouTube EDF : Présentation des activités d'EDF DTG
Profil souhaité
Votre profil ♀️
Vous êtes en école d’ingénieur ou en master 2 avec une spécialité en data science, mathématiques appliquées, ou TAL/NLP.
Vous avez un intérêt pour le secteur de l’énergie et pour les solutions d’IA génératives textuelles (LLM).
Dans le cadre de votre diplôme BAC+4/5 vous avez un stage à effectuer.
⏳ Durée du stage : 6 mois
Lieu :134 Chemin de l'Étang, 38950 Saint Martin Le Vinoux (à 15 minutes de Grenoble en transport en commun)
Nous recherchons les compétences et qualités suivantes pour ce poste :
· Capacité d'adaptation
· Autonomie
· Capacité d'analyse, de synthèse
· Bonne maîtrise de Python et des librairies scientifiques usuelles serait souhaitable, de même que des connaissances en TAL/NLP
Ce qu’EDF peut vous offrir
· une aide au logement de 185 € maximum si obligation de déménager pour faire le stage
· une aide sur les abonnements de transport en commun (remboursement de 70% de l’abonnement mensuel)
Pour candidater
· votre CV
· une lettre de motivation
· vos bulletins de notes des deux dernières années
Conformément aux engagements pris par EDF SA en faveur de l'accueil et de l'intégration des personnes en situation de handicap, cette alternance est ouverte à toutes et à tous, sous réserve de l'accord de la médecine du travail.