L’IA pour l’audio : de la création à l’imitation…tout un nouveau territoire à explorer
03 mars 2023 par Roxanne Natta

L’IA pour l’audio : de la création à l’imitation…tout un nouveau territoire à explorer

La newsletter de la radio de demain #289… Abonnez-vous

RadioGPTVALL-E…  Futuri et Microsoft mobilisent l’attention en ce moment sur les usages de l’IA pour l’audio. Ils œuvrent au côté de nombreux autres acteurs – l’IRCAM en France, Respeecher en Ukraine par exemple – pour développer de nouvelles technologies qui reposent sur un pan de l’intelligence artificielle : la vocalisation de contenus.

D’ailleurs, cet article est accessible dès aujourd’hui et pour la première fois en version vocale sur le site Hyperradio grâce à l’outil Readspeaker. Il permettra aux personnes souffrant de déficiences visuelles d’accéder à nos articles  grâce à une voix synthétisée. Vos retours d’expérience nous sont précieux, n’hésitez pas à nous contacter via le site, sur TwitterLinkedIn ou par mail à l’adresse suivante : pole_innovation@radiofrance.com 

Une technologie propice à la désinformation et aux détournements

Depuis que Microsoft a présenté son nouveau modèle de synthèse vocale qui s’appuie sur l’intelligence artificielle, des critiques émergent sur ses potentiels dangers et éventuelles dérives. Avec la promesse de reproduire à la perfection le timbre d’une voix humaine, VALL-E présente des risques d’usurpation d’identité vocale. Ces technologies peuvent aussi être utilisées pour créer des deepfakes audio, et donc faire dire à peu près n’importe quoi à des individus sans leur consentement, comme cela a été fait avec la voix d’Emma Watson… à qui l’on a fait lire des extraits de Mein Kampf. De la même manière, la reproduction par David Guetta de la voix d’Eminem ou la reprise virale de la voix d’Ariana Grande sont autant d’événements qui pourraient constituer une menace pour l’industrie musicale. Ces outils présentent aussi des risques politiques et sociétaux en donnant la possibilité de générer des contenus haineux et/ou de désinformation.

Le doublage à l’ère de l’IA : prochain métier à disparaître ou nouvel âge d’or ? 

Dernièrement, de nombreux acteurs de doublage ont d’ailleurs exprimé leurs craintes face à l’essor de l’intelligence artificielle génératrice de voix, qui pourrait éventuellement les remplacer sans compensation financière supplémentaire. Des segments entiers de l’industrie pourraient ainsi se retrouver au chômage… Acteurs de doublage, prochain métier à disparaître ? Les acteurs disent qu’on leur demande (carrément) de “donner” leur voix à l’IA. Il existe en effet des clauses dans leurs contrats qui donnent le droit d’utiliser la voix d’un acteur pour la création de voix synthétiques sans aucune compensation supplémentaire. On retrouve d’ailleurs le même phénomène dans le domaine de l’édition et des livres audio.

Les acteurs sont cependant également moteurs dans l’entraînement des IA, ce qui pourrait devenir une vraie évolution dans leur métier, leur permettant de continuer à jouer avec leur voix et celle de leur double numérique… qui leur subsistera peut-être ? Le deepfake de Carrie Fisher serait l’annonciateur d’une série de remodélisation des acteurs par l’image et par la voix pour construire toujours des nouveaux contenus “exclusifs” à des fins créatives et de divertissement. Brigitte Cordier n’a qu’à bien se tenir ?

La vocalisation de contenus utilisée à des fins créatives et de divertissement : des outils accessibles et innovants

La semaine dernière, la société américaine Futuri a annoncé le lancement de RadioGPT, la première “station de radio” basée sur l’intelligence artificielle. En combinant la technologie GPT-3 – la même qui alimente ChatGPT – et l’identification des sujets tendance localement, la station dispose d’un script lu à l’antenne par une (et jusqu’à 3 !) voix d’IA, qui peuvent même être entraînées à imiter la voix d’animatrices et d’animateurs réels. 

VALL-E, le nouveau modèle de synthèse vocale basé sur l’intelligence artificielle et présenté par Microsoft, est quant à lui capable de reproduire à la perfection le timbre d’une voix humaine (le ton et l’émotion) – avec seulement trois secondes d’enregistrement audio. La seule faiblesse de ce dispositif étant que l’IA a du mal à apprendre les accents appuyés. Pour corriger ce biais, VALL-E devra simplement diversifier sa base de connaissances avec de nombreux corpus audio (les algorithmes se basent sur des bases de données… incomplètes quand elles ne sont pas racistes !).

Les artistes et créateurs de contenus peuvent tirer profit de ces nouveaux outils en s’en servant pour mettre en avant leur travail, comme l’a fait Peter Hollens sur sa chaîne YouTube. L’IA générative sera peut-être une technologie accessible et utile à toute personne qui souhaiterait s’en emparer pour développer ses compétences créatives. L’IA, nouveau bac à sable qui facilitera la vie aux artistes en herbe, ou outil réservé aux professionnels des Industries Culturelles et Créatives ? 

Une image générée par Midjourney

Cette semaine

Whatsapp s’apprêterait à déployer une nouvelle fonctionnalité permettant l’envoi de newsletter privées via son service. 
En savoir plus 

Spotify teste l’accès à des playlists exclusivement réservées aux détenteurs de NFT.
En savoir plus

ChatGPT : Meta dégaine à son tour une IA générative pour contrer Microsoft et Google.
En savoir plus

Le groupe VW vient de présenter le tableau de bord des futurs véhicules Audi au salon mondial du mobile à Barcelone. La radio publique allemande y proposera une app pour écouter des contenus en fonction de sa géolocalisation
En savoir plus

En bref @ Radio France

« Jean-Marie Le Pen, l’obsession nationale », une nouvelle série dans la collection de podcasts Face à l’histoire, proposée par Philippe Collin.
En savoir plus

Dans la saison 2 de Meurte et Moselle diffusée sur France Bleu, Nicolas Turon revient avec huit nouvelles histoires policières de fiction tirées d’anecdotes et de faits réels mosellans.
En savoir plus

« La typographie : ce qu’on voit, ce qu’on ne voit pas ». Dans Le code a changé, Xavier de La Porte décode le numérique et s’interroge sur le fonctionnement du Web et des réseaux sociaux.
En savoir plus

L’Orchestre Philharmonique de Radio France et FIP se lancent dans le deuxième numéro de Classique & Mix.
En savoir plus

L’incroyable expédition de Corentin Tréguier au Congo. Une BD qui éclaire avec sarcasme et réalisme la face cachée des expéditions françaises à l’ère coloniale.
En savoir plus 

Des extraits d’émissions phares de l’antenne, des formats natifs incarnés par leurs journalistes, des interviews coulisse d’invités : découvrez le compte TikTok de Mouv’.
En savoir plus 

Fip, l’Adami et le Disquaire Day, dévoilent la programmation de SESSION UNIK 2023 : Vidéos, concerts et vinyles inédits sont au rendez‐vous ! En savoir plus