13 juin 2025 par Sofiane Kolli

Les messages vocaux, pour le meilleur comme pour le pire

La newsletter de la radio de demain #395… Abonnez-vous

Les messages vocaux changent de plus en plus notre manière de communiquer Pratique pour l’envoyeur, parfois désagréable pour le receveur, ils remplacent les simples SMS ou même les coups de fil, et ce même au bureau. Revue des actualités de nos échanges podcastés et de la façon dont l’IA s’en inspire.

D’un message vocal à un podcast, il n’y a qu’un pas

“Ouais, alors, un vocal rapide pour te dire que…” et huit minutes après, on est encore scotché à notre téléphone. Depuis les années 2010, l’utilisation et la réception des messages vocaux ont bien évolué : d’un message intéressant, pratique à un enregistrement de plusieurs minutes que l’on rechigne à ouvrir. Une expérience devenue quasi-universelle, si bien que nos messageries préférées proposent désormais des retranscriptions pour les lire.

Depuis janvier, même WhatsApp propose sa version de cette fonctionnalité si pratique. Si, si, on vous le jure. Il suffit juste de l’activer dans les réglages de l’application. Du côté d’Instagram, Meta mise gros. Comme on vous l’expliquait, plusieurs nouveautés sont récemment arrivées dans nos DMs. Et en termes de messages vocaux, une qui n’est pas des moindres : la possibilité d’enregistrer jusqu’à cinq minutes de bla-bla. Un véritable one-man show.

Un mode d’expression déjà reproduit par l’IA

Finalement, le plus beau mais le plus embêtant dans ces messages vocaux reste les silences, les hésitations, les retours en arrière : ce qui rend humaines nos longues phrases. C’est ce que propose “Unmute” du labo Kyutai : un modèle d’IA text-to-speech qui nous répond naturellement, en incorporant donc des silences, des hésitations, et même en nous coupant de temps en temps la parole.

Dans la même veine, ElevenLabs lance des agents IA vocaux multilingues et multivoix avec la capacité de générer des voix naturelles dans plusieurs langues et avec différents timbres. Des IA pour discuter qui représentent un bond en avant dans le naturel des voix synthétiques, de quoi séduire les entreprises.

Et pour générer ces voix, la startup Resemble AI propose Chatterbox, un modèle text-to-speech open source capable d’imiter une voix en quelques secondes et surtout de parler de manière fluide en incorporant des hésitations et même des émotions. Avec son énorme catalogue, les développeurs peuvent facilement expérimenter avec les différentes voix. A quand une nouvelle voix pour Siri ?

A emporter

▶️ Le streaming, le streaming, tout pour le streaming

✈️ Retrouvez votre playlist préférée à 40 000 pieds

📰 Apple propose Journal sur Mac et iPad

💰 Seriez-vous prêt à utiliser l’IA pour vos achats ?

L’actu Radio France

💟 Ondes immersives : 12 variations spatialisées sur le dialogue amoureux par France Culture : découvrez 12 créations sonores originales : 12 variations de moins de 10 minutes sur le dialogue amoureux, conçues et mixées en son spatialisé par des étudiants en écoles de son. Une expérience inédite en son immersif, à écouter au casque, pour tendre l’oreille aux créateurs de demain.

🏅 Le sport par France Musique : Octave et Mélo ne sont pas que musiciens. Ils sont aussi sportifs et aiment tester différentes activités comme le foot, l’équitation, la danse ou le ski. Suis-les dans leurs aventures !

✒️ Un été avec Victor Hugo par France Inter : voici une nouvelle série de la collection de France Inter « Un été avec ». Cette fois, c’est le grand écrivain Victor Hugo qui est raconté par Guillaume Gallienne.

🏔️ En route vers le Grand Nord par franceinfo : après avoir parcouru le globe avec leur voilier, marins et scientifiques de la fondation Tara vont s’établir durablement sur la banquise arctique. Dans cette deuxième saison, découvrez la Tara Polar Station, une vigie scientifique du Grand Nord, à l’image de la Station Spatiale Internationale.