Le clonage audio : quand l’IA joue avec votre voix
17 septembre 2021 par Iniz Becker

Le clonage audio : quand l’IA joue avec votre voix

La newsletter de la radio de demain #224… Abonnez-vous

Cloner sa voix à l’aide d’une intelligence artificielle est aujourd’hui à la fois fastidieux et simple, ce qui est le signe d’une technologie presque mature et prête à être rendue publique. Mais comment ça marche ?

Popularisation d’une pratique devenue accessible

Il suffit de parler dans un micro pendant une trentaine de minutes, en lisant un script aussi clairement que possible. Après avoir démarré et arrêté des dizaines de fois pour réenregistrer vos bafouillages ou autres marmonnements, les fichiers audio obtenus doivent être traités par un algorithme. Quelques heures plus tard, une copie de votre voix est prête et vous attend : vous pourrez taper ce que vous voulez dans une boîte de dialogue et votre clone IA vous le dira en retour avec un résultat audio réaliste qui pourrait même tromper vos amis et votre famille, du moins pendant quelques instants. Le fait qu’un tel service existe doit être questionné car on réalise encore peu les impacts de la facilité d’accès à cette technologie.

Pour Baidu, numéro 1 de l’IA en Chine, il suffirait en vérité d’enregistrer uniquement 3,7 secondes de temps de parole pour pouvoir reproduire (ou déformer) tous les discours du monde. Créer des deepfakes audio aujourd’hui est si simple que ce tuto attise la curiosité de près de 60 000 personnes…

Who are you?

Les progrès récents de la technologie sont tels que l’on dit que l’audio généré par ordinateur est maintenant d’une précision déconcertante. Le logiciel peut capter non seulement votre accent, mais aussi votre timbre, votre rythme, votre débit de parole et votre respiration : des fonctionnalités qui ne peuvent que plaire aux cybercriminels !

A l’heure où les plateformes font évoluer la construction de nouvelles identités et la perception de ces dernières, le clonage vocal participe également de la transformation de l’individu. Sur TikTok, Instagram ou Twitch, on peut imaginer les communautés d’internautes utiliser les clones vocaux de leurs idoles quand tout s’automatise et que « tout n’est que remix »… vers un transhumanisme de la voix ?

Cette semaine

Discord lève 500 millions de dollars et double sa valorisation. En savoir plus

La console de jeu Nintendo Switch se met à l’audio Bluetooth. En savoir plus

Lancement d’un accélérateur de start-up spécialisées dans les neurosciences. En savoir plus

Le code source de FranceConnect va s’ouvrir. En savoir plus

Le Monde inaugure une nouvelle formule video, le Snapshow. En savoir plus

En bref @ Radio France

Le vrai du faux décryptant sur franceinfo l’actualité, propose un nouveau rendez-vous de fact-checking pour les ados et la famille avec Le vrai du faux JuniorA retrouver sur la plateforme Radio France

France Bleu lance le « Prix France Bleu du jeu vidéo ». En savoir plus

Mouv’ lance sa nouvelle série vidéo Skaters In Paris, le rendez-vous dédié au skateboard. En savoir plus

Nouvelle saison des Mécaniques du complotisme sur France Culture avec une mise en lumière de l’irruption de la mouvance QAnon. En savoir plus