Le doublage automatique alimenté par l’IA de YouTube La fonctionnalité est désormais disponible pour des centaines de milliers de créateurs dans le cadre du Programme Partenaire YouTube. Initialement introduite lors de la VidCon l’année dernière avec un déploiement limité, la fonctionnalité est désormais accessible aux chaînes axées sur le contenu informatif, notamment les didacticiels et les vidéos éducatives. YouTube prévoit de l’étendre prochainement à d’autres types de contenus.
Qu’est-ce que le doublage basé sur l’IA sur YouTube ?
Lorsque les créateurs mettent en ligne une vidéo, YouTube détecte automatiquement la langue d’origine et génère des versions doublées à l’aide de l’IA. Le doublage automatique basé sur l’IA de YouTube prend en charge les langues ci-dessous :
- Anglais (pour traduction dans d’autres langues prises en charge)
- Français
- Allemand
- hindi
- indonésien
- italien
- japonais
- portugais
- Espagnol
L’outil de doublage YouTube AI crée des doublages dans toutes les langues prises en charge pour les vidéos en anglais. Cependant, lorsque vous téléchargez des vidéos dans l’une des autres langues prises en charge, cela ne générera qu’un doublage en anglais. Pour l’instant, vous ne pouvez pas télécharger une vidéo en français et générer une version doublée en italien selon l’état actuel de la mise en œuvre du doublage automatique.
Accédez au Langues section dans YouTube Studio où vous pouvez consulter, publier, dépublier ou supprimer les versions doublées. Les vidéos doublées portent un doublé automatiquement étiquette, et les téléspectateurs peuvent passer à l’audio original à l’aide de l’option Piste audio.
Lire aussi :
Comment fonctionne le doublage basé sur l’IA de YouTube
Le nouvel outil de doublage de YouTube exploite l’IA Gemini de Google pour générer ces versions doublées. Lorsque le créateur met en ligne la vidéo pour la première fois, Google utilise son traitement du langage naturel (NLP) pour sous-identifier automatiquement la langue, quels que soient les accents et les dialectes. Ensuite, l’audio est transcrit en texte à l’aide de l’API Google Speech-to-Text. Une fois transcrit, le texte est traduit dans la ou les langues cibles avec Google Translate, qui utilise des modèles de traduction automatique neuronale (NMT).
Le texte traduit est ensuite converti en audio à l’aide de Google Gemini AI en utilisant une technologie comme WaveNet. C’est ce qu’on appelle la génération de voix synthétique. Les pistes audio doublées sont automatiquement synchronisées avec la vidéo originale et téléchargées avec la vidéo dans YouTube Studio.
Les doublages actuels générés par l’IA peuvent manquer de ton parfait et de fidélité émotionnelle. Cependant, YouTube travaille sur une amélioration appelée Expressive Speech. Cette fonctionnalité en cours de développement avec Google DeepMind se concentre sur la reproduction du ton, des émotions et même de l’ambiance du créateur de l’environnement d’origine. Présenté en avant-première au Réalisé sur YouTube événement, cette amélioration promet de rendre les doublages automatiques plus naturels et plus attrayants.
Aider les créateurs à atteindre un public mondial
En élargissant la portée du doublage basé sur l’IA, YouTube aide les créateurs à se connecter avec des publics du monde entier et à rendre le contenu plus inclusif. Bien que la technologie en soit encore à ses débuts, la collaboration de YouTube avec Google DeepMind et Google Translate signale des améliorations continues.
Bien que la mise en œuvre actuelle présente certaines limites, telles que des combinaisons de langues restreintes et des doublages moins expressifs, les futures mises à jour devraient combler ces lacunes.