Stage Evaluation automatique de la qualité spatiale audio F/H
Stage Cesson-Sévigné (Ille-et-Vilaine) Développement informatique
Description de l'offre
about the role
#Audio3D #spatial #audiospatialisé #psychoacoustique
Contexte : Orange développe de longue date une expertise en audio spatialisé (ou audio 3D) avec des technologies comme l’ambisonique ou le binaural. Orange a contribué au standard MPEG-H supportant le HOA (Higher Order Ambisonic), et plus récemment au standard 3GPP IVAS (Immersive Voice and Audio Services) qui inaugure la capacité d’un codec conversationnel à adresser des services immersifs. Ce dernier bénéficiera entre autres aux téléconférences et s’insérera dans des expériences de Réalité Augmentée.
Au cours du développement d’un codec pour le son spatialisé, il est nécessaire d’évaluer la qualité de l’écoute spatiale. Pour cela, une méthode standard est le test MUSHRA (pour Multiple Stimuli with Hidden Reference and Anchor) (ITU-R BS.1534, p.4). Il consiste à organiser des séances de test d’écoute avec un panel d’auditeur-ices notant la qualité de différents sons qui leur sont présentés. Ces tests sont longs à mettre en place (pré-tests) et à conduire (40 min de test d’écoute par personne). Aussi, les réponses des participant-es sont bruitées à cause de différents facteurs inhérents à l'évaluation subjective humaine (fatigue, concentration variable, expérience, etc.). Pour cette raison, il est nécessaire d’avoir un nombre de participant-es important (supérieur à 20).
C’est pourquoi, la communauté de recherche a depuis longtemps cherché des algorithmes qui prédisent les résultats de test subjectifs moyens à partir des fichiers sonores. On peut citer comme exemple : STOI pour évaluer l’intelligibilité de la parole, PESQ pour évaluer la qualité de la parole. Ces algorithmes ne permettent pas de remplacer complètement les tests d’écoute mais au moins de permettre d’avoir des mesures préliminaires et une métrique partagée pour comparer des résultats entre laboratoires.
Pour l’audio spatialisé, une méthode d’évaluation nommée AMBIQUAL a été proposée récemment. Celle-ci vise à évaluer la qualité d’écoute et la précision de localisation d’une scène sonore au format ambisonique d’ordre 3. Elle a l’avantage d’être indépendante du système de rendu (sur un système de haut-parleur donné ou en binaural). Néanmoins, elle présente de nombreuses limites : elle se montre relativement fiable uniquement pour une scène sonore composée d’une seule source directionnelle et sans réverbération spatiale.
Pour évaluer facilement les artéfacts introduits par un codec audio, il manque aujourd’hui une méthode d’évaluation du type d’AMBIQUAL qui fonctionne sur des contenus plus divers et réalistes.
Vos missions :
Le travail de stage (6 mois) se déroulera selon un calendrier décrit ci-dessous :
· S’approprier le sujet et faire une étude bibliographique (1 mois),
· Faire de test perceptifs MUSHRA sur un dôme de haut-parleurs et/ou au casque (2 mois),
· Développer un algorithme d’évaluation automatique de la qualité audio spatiale (2 mois),
· Rédiger le rapport et préparer la soutenance (1 mois).
about you
Formation souhaitée :
· Vous êtes actuellement en Master 2 ou école d’ingénieur à dominante recherche et vous préparez une formation dans le domaine du traitement du signal, de la psychoacoustique et/ou de l’audio
Pré-requis techniques :
· Maîtrise du traitement du signal audio
· Connaissances en psychoacoustique pour l’audio spatialisé et formation à l’écoute critique
· Maîtrise de Python. Idéalement expérience avec PyTorch.
· Idéalement, connaissance des outils de production audio (Digital Audio Workstation (DAW), système de diffusion professionnel)
· Savoir synthétiser et communiquer efficacement
Aptitudes personnelles :
· Forte appétence pour le traitement du signal et l’audio
· Appétence pour la démarche expérimentale
· Maîtrise de l’anglais
· Autonomie
additional information
Vous contribuerez, au sein d’une équipe de recherche à l’état de l’art des connaissances sur le domaine. Vous serez amené à travailler avec des équipements professionnels et expérimentaux à l’état de l’art (dôme de haut-parleur pour de l’ambisonique ordre 5, méthode de binauralisation, etc.). Vous travaillerez ainsi sur des technologies qui seront de plus en plus utilisées dans le futur. Vous pourrez être amenés à déposer un ou plusieurs brevets, et à participer à la publication d’articles.
department
Intégrez une équipe expérimentée et reconnue dans le domaine de l'audio !
Le département Audio et Telco Services a pour ambition d’offrir à nos clients la meilleure expérience digitale, en anticipant, développant et intégrant de bout en bout les services de communication temps réel multicanaux. Le département porte également une expertise sur les devices mobiles et une expertise audio/voix, de la recherche au delivery.
3 équipes constituent le département :
· Equipe Rich Instant Messaging qui porte le Skill center Google RCS et les activités de messaging
· Equipe Mobile Service and Sollicitation qui assure le développement des services mobiles et des plateformes associées
· Equipe Immersive Communications and Audio Expertise qui travaille sur les activités de recherche et de standardisation dans le domaine de l’audio.
contract
Internship
Duration : 6 mois
Start date : 03 Feb 2025
Niveau d’études préparé pendant le stage
Indemnité brute selon école
Bac+5
de 1572 € à 2096 € / mois
Only your skills matter
Regardless of your age, gender, origin, religion, sexual orientation, neuroatypia, disability or appearance, we encourage diversity within our teams because it is a strength for the collective and a vector of innovation. Orange Group is a disabled-friendly company: don't hesitate to tell us about your specific needs.