Technologie

Des écouteurs intelligents dotés d’IA proposent une traduction de groupe avec clonage vocal et audio spatial en 3D.

Publié

on

Résumé :

Une équipe de chercheurs de l’Université de Washington, dirigée par Tuochao Chen, a développé un système de casque innovant capable de traduire simultanément plusieurs orateurs tout en préservant la direction et les caractéristiques vocales de chacun.

Ce système, nommé "traduction de la parole spatiale", utilise des écouteurs antibruit équipés de microphones pour détecter et suivre les voix dans différents environnements.

Contrairement à d’autres technologies qui ne traduisent qu’une seule voix à la fois, cette approche offre une solution pratique pour des espaces publics bruyants.

Le système a été testé avec succès dans divers cadres et a été présenté lors de la conférence ACM CHI.

Il permet non seulement une traduction avec un léger délai de 2 à 4 secondes, mais aussi de maintenir la profondeur et l’expressivité des voix.

Chen espère que cette innovation contribuera à briser les barrières linguistiques, permettant aux utilisateurs de comprendre les discussions en temps réel, même dans des pays où ils ne parlent pas la langue locale.

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Populaires

Quitter la version mobile