Post-Doc sur le TAL pour l'aide à la conception de nouveaux matériaux F/H
Stage Saclay (Essonne)
Description de l'offre
Détail de l'offre
Informations générales
Entité de rattachement
Le CEA est un acteur majeur de la recherche, au service des citoyens, de l'économie et de l'Etat.Il apporte des solutions concrètes à leurs besoins dans quatre domaines principaux : transition énergétique, transition numérique, technologies pour la médecine du futur, défense et sécurité sur un socle de recherche fondamentale. Le CEA s'engage depuis plus de 75 ans au service de la souveraineté scientifique, technologique et industrielle de la France et de l'Europe pour un présent et un avenir mieux maîtrisés et plus sûrs.
Implanté au cœur des territoires équipés de très grandes infrastructures de recherche, le CEA dispose d'un large éventail de partenaires académiques et industriels en France, en Europe et à l'international.
Les 20 000 collaboratrices et collaborateurs du CEA partagent trois valeurs fondamentales :
• La conscience des responsabilités
• La coopération
• La curiosité
Référence
2024-34490Description de l'unité
Au Département Intelligence Ambiante et Systèmes Interactifs (DIASI), les équipes du Laboratoire d'Analyse Sémantique Texte et Image (LASTI) développent des technologies innovantes de traitement automatique des langues et des données multimédia et multilingues. Les sujets abordés au sein du laboratoire vont de l'analyse et l'extraction d'information à partir de documents textes et images jusqu'aux agents conversationnels, en passant par la construction de ressources linguistiques pour les langues peu dotées.
Description du poste
Domaine
Sciences pour l'ingénieur
Contrat
Post-doctorat
Intitulé de l'offre
Post-Doc sur le TAL pour l'aide à la conception de nouveaux matériaux F/H
Sujet de stage
Ce Post-Doc porte sur l'utilisation du Traitement Automatique des Langues (TAL) et de l'intelligence artificielle pour extraire automatiquement des données pertinentes issues de la littérature scientifique afin de faciliter le design de matériaux innovants.
Durée du contrat (en mois)
36 mois
Description de l'offre
« Rejoignez le CEA pour donner du sens à votre activité, mener et soutenir des projets de R&D nationaux et internationaux, cultiver et faire vivre votre esprit de curiosité. »
EN SYNTHESE, QU’EST-CE QUE NOUS VOUS PROPOSONS ?
Le CEA propose unPost-Docsur le TAL pour l'aide à la conception de nouveaux matériaux pour la CEA/DRT (Direction de la Recherche Technologique). Ce Post-Doc de 36 mois est basé sur le siteNano-Innovde Paris-Saclay, Essonne (91).
Il s'agit d'un Post-Doc à pourvoir à partir dès que possible.
POURQUOI NOUS REJOINDRE ?
Dans le cadre d’un projet de recherche en association avec d’autres laboratoires du CEA, le LASTI vise à exploiter les technologies duTraitement Automatique des Langues(TAL) pour automatiser l’extraction d’information depuis la littérature scientifique dans le domaine des matériaux.
Plus précisément, le domaine d’application du projet est ledesign de matériaux innovants: cet objectif nécessite d’explorer l’état de l’art pour connaître les donnéesmatériaux, par exemple les compositionschimiqueset les valeurs ou tendances concernant les propriétés clés mesurées dans l’étude ainsi que les caractéristiques du type d’essais réalisé.
L’objectif du projet est d’exploiter des techniquesd’intelligence artificiellepour réaliser cette exploration de façon automatique et extraire les données d’intérêt à partir du texte des articles scientifiques ou brevets considérés.
L’objectif à terme sera d’intégrer les informations extraites dans un système existantbasé sur uneIA symboliquepour fournir un assistant numérique pour le design des matériaux innovants.
Le travail se fera encollaborationavec le laboratoire du CEA qui développe ce système de raisonnement et unlaboratoire du CEA spécialisé sur les matériaux qui apportera son expertise sur les informations pertinentes à extraire.
De plus, le candidat sélectionné intégrera une équipepluridisciplinaireautour de cet assistant, constitué de permanents, postdoctorants et doctorants.
QU’ATTENDONS-NOUS DE VOUS ?
Les missions du poste seront les suivantes :
- Réaliserun état de l’art dans l’application du TAL pour les données matériaux;
- Constituerun jeu de données de référence d’articles scientifiques à partir de sources identifiées (journaux, sites)
- Développerdes approches pour l’extraction d’information à partir de ces données : on s’intéressera en particulier :
- aux approches frugales: sans apprentissage (zero-shot), en s’appuyant sur de grands modèles de langue (LLMs) ou avec un apprentissage à partir de peu de données (few-shot learning)
- aux approches d'IA hybridecombinant l’exploitation de connaissances explicites (bases de données, thesaurus) avec les modèles par apprentissage.
#CEA-List
#AI
Profil recherché
Profil du candidat
COMPÉTENCES REQUISES :
NiveauDoctoratavec des connaissances en machine learning, deep learning et traitement automatique des langues,
Compétences techniques (liste informative) :
- Langages de programmation: Python
- Librairies et frameworks: scikit-learn, Pytorch, transformers, optuna, spaCy
- Devops: docker, docker-compose, slurm, git
Conformément aux engagements pris par le CEA en faveur de l’intégration de personnes en situation de handicap, cet emploi est ouvert à tous et toutes.