Le clonage audio : quand l’IA joue avec votre voix
La newsletter de la radio de demain #224… Abonnez-vous
Cloner sa voix à l’aide d’une intelligence artificielle est aujourd’hui à la fois fastidieux et simple, ce qui est le signe d’une technologie presque mature et prête à être rendue publique. Mais comment ça marche ?
Popularisation d’une pratique devenue accessible
Il suffit de parler dans un micro pendant une trentaine de minutes, en lisant un script aussi clairement que possible. Après avoir démarré et arrêté des dizaines de fois pour réenregistrer vos bafouillages ou autres marmonnements, les fichiers audio obtenus doivent être traités par un algorithme. Quelques heures plus tard, une copie de votre voix est prête et vous attend : vous pourrez taper ce que vous voulez dans une boîte de dialogue et votre clone IA vous le dira en retour avec un résultat audio réaliste qui pourrait même tromper vos amis et votre famille, du moins pendant quelques instants. Le fait qu’un tel service existe doit être questionné car on réalise encore peu les impacts de la facilité d’accès à cette technologie.
Pour Baidu, numéro 1 de l’IA en Chine, il suffirait en vérité d’enregistrer uniquement 3,7 secondes de temps de parole pour pouvoir reproduire (ou déformer) tous les discours du monde. Créer des deepfakes audio aujourd’hui est si simple que ce tuto attise la curiosité de près de 60 000 personnes…
Who are you?
Les progrès récents de la technologie sont tels que l’on dit que l’audio généré par ordinateur est maintenant d’une précision déconcertante. Le logiciel peut capter non seulement votre accent, mais aussi votre timbre, votre rythme, votre débit de parole et votre respiration : des fonctionnalités qui ne peuvent que plaire aux cybercriminels !
A l’heure où les plateformes font évoluer la construction de nouvelles identités et la perception de ces dernières, le clonage vocal participe également de la transformation de l’individu. Sur TikTok, Instagram ou Twitch, on peut imaginer les communautés d’internautes utiliser les clones vocaux de leurs idoles quand tout s’automatise et que « tout n’est que remix »… vers un transhumanisme de la voix ?
Cette semaine
Discord lève 500 millions de dollars et double sa valorisation. En savoir plus
La console de jeu Nintendo Switch se met à l’audio Bluetooth. En savoir plus
Lancement d’un accélérateur de start-up spécialisées dans les neurosciences. En savoir plus
Le code source de FranceConnect va s’ouvrir. En savoir plus
Le Monde inaugure une nouvelle formule video, le Snapshow. En savoir plus
En bref @ Radio France
Le vrai du faux décryptant sur franceinfo l’actualité, propose un nouveau rendez-vous de fact-checking pour les ados et la famille avec Le vrai du faux Junior. A retrouver sur la plateforme Radio France
France Bleu lance le « Prix France Bleu du jeu vidéo ». En savoir plus
Mouv’ lance sa nouvelle série vidéo Skaters In Paris, le rendez-vous dédié au skateboard. En savoir plus
Nouvelle saison des Mécaniques du complotisme sur France Culture avec une mise en lumière de l’irruption de la mouvance QAnon. En savoir plus