Développement d'outils d'extraction textuels pour l'enrichissement de graphes de connaissances F/H
Stage Belfort (Territoire de Belfort) Développement informatique
Description de l'offre
about the role
Dans le cadre d’un projet de recherche portant sur la structuration des connaissances dans des graphes de connaissances d’entreprise et leur valorisation à l’aide de modèles de langage larges et d’interface graphiques innovantes, cette offre de stage propose de concevoir et implémenter des outils d’extraction de connaissances à partir de documents. Pour cela, vous mettrez en place des techniques d’extraction de connaissances et d’entity linking afin d’alimenter des graphes de connaissances de l’entreprise Orange en cours de construction. Dans une première étape, ce stage propose d’étudier les technologies de l’ingénierie des connaissances, les techniques de traitement automatique des langues et les modèles de langage. Dans un second temps, le stagiaire participera à la conception de nouveaux outils d’extraction de connaissances pour enrichir le graphe de connaissances Telcograph en s’appuyant sur des approches d’intégration de données.
Vous collaborez à la construction d’un graphe de connaissances d’entreprise pour Orange :
· Vous contribuez à la conception et au développement d’outils d’extraction de connaissances.
· Vous définissez, implémentez et évaluer des approches d’intégration de données et d’enrichissement du graphe.
· Vous contribuez à l’expertise de l’équipe de recherche dans le domaine du développement de graphes de connaissances collaboratifs sur une plateforme Wikibase.
· Vous participez à la vie de l’équipe de recherche via des réunions de suivi du projet et des présentations de vos travaux.
· Vous collaborez à la rédaction de rapports techniques et de documentation ainsi qu’à l’éventuelle valorisation scientifique des travaux.
about you
Formation souhaitée :
· Vous préparez une formation de niveau Bac +5 (master ou école d’ingénieurs)
Compétences et qualités personnelles recherchées :
· Vous maitrisez les techniques de traitement automatique des langues
· Vous possédez les compétences nécessaires au développement de logiciels et avez une bonne connaissance du langage Python.
· Vous avez des connaissances dans plusieurs technologies du Web Sémantique et plus particulièrement les langages de représentation de connaissances RDF/RDFS et OWL ainsi que le langage d’interrogation SPARQL.
· Vous aimez trouver des solutions pour répondre à un besoin et ne craignez pas de vous remettre en question.
· Vous êtes capable de mener à bien un sujet et d’être force de proposition.
· Vous êtes enthousiaste, autonome et proactif.
· Vous avez un bon sens de l'analyse et êtes rigoureux dans l’exécution de votre mission.
La priorité sera donnée aux étudiants intéressés par la recherche.
additional information
Vous serez intégré au sein d’une équipe de recherche dynamique, à la pointe de l’innovation et de l’expertise dans le domaine de l’ingénierie des connaissances et des modèles de langage. Le stage pourra donner lieu à des activités de valorisation scientifiques (publications) selon les résultats obtenus.
department
Au sein de la direction Data & IA, le département INK (Intelligence, Network and Knowledge) est spécialisé dans les domaines de la Data Science, du Deep Learning et de l’ingénierie des connaissances. Il met à profit des techniques d’intelligence artificielle sur des applications variées parmi lesquelles l’optimisation et l’automatisation de la gestion des réseaux mobiles/fixes/véhiculaires, la gouvernance des données et l’amélioration de l’expérience client. Le stage se déroule dans les locaux d’Orange sur le parc d’activités du Techn’hom à Belfort.
contract
Internship
Duration : 6 mois
Start date : 03 Feb 2025
Niveau d’études préparé pendant le stage
Indemnité brute selon école
Bac+5
de 1572 € à 2096 € / mois
Only your skills matter
Regardless of your age, gender, origin, religion, sexual orientation, neuroatypia, disability or appearance, we encourage diversity within our teams because it is a strength for the collective and a vector of innovation. Orange Group is a disabled-friendly company: don't hesitate to tell us about your specific needs.