
Les messages vocaux, pour le meilleur comme pour le pire
La newsletter de la radio de demain #395… Abonnez-vous
Les messages vocaux changent de plus en plus notre manière de communiquer Pratique pour l’envoyeur, parfois désagréable pour le receveur, ils remplacent les simples SMS ou même les coups de fil, et ce même au bureau. Revue des actualités de nos échanges podcastés et de la façon dont l’IA s’en inspire.
D’un message vocal à un podcast, il n’y a qu’un pas
“Ouais, alors, un vocal rapide pour te dire que…” et huit minutes après, on est encore scotché à notre téléphone. Depuis les années 2010, l’utilisation et la réception des messages vocaux ont bien évolué : d’un message intéressant, pratique à un enregistrement de plusieurs minutes que l’on rechigne à ouvrir. Une expérience devenue quasi-universelle, si bien que nos messageries préférées proposent désormais des retranscriptions pour les lire.
Depuis janvier, même WhatsApp propose sa version de cette fonctionnalité si pratique. Si, si, on vous le jure. Il suffit juste de l’activer dans les réglages de l’application. Du côté d’Instagram, Meta mise gros. Comme on vous l’expliquait, plusieurs nouveautés sont récemment arrivées dans nos DMs. Et en termes de messages vocaux, une qui n’est pas des moindres : la possibilité d’enregistrer jusqu’à cinq minutes de bla-bla. Un véritable one-man show.
Un mode d’expression déjà reproduit par l’IA
Finalement, le plus beau mais le plus embêtant dans ces messages vocaux reste les silences, les hésitations, les retours en arrière : ce qui rend humaines nos longues phrases. C’est ce que propose “Unmute” du labo Kyutai : un modèle d’IA text-to-speech qui nous répond naturellement, en incorporant donc des silences, des hésitations, et même en nous coupant de temps en temps la parole.
Dans la même veine, ElevenLabs lance des agents IA vocaux multilingues et multivoix avec la capacité de générer des voix naturelles dans plusieurs langues et avec différents timbres. Des IA pour discuter qui représentent un bond en avant dans le naturel des voix synthétiques, de quoi séduire les entreprises.
Et pour générer ces voix, la startup Resemble AI propose Chatterbox, un modèle text-to-speech open source capable d’imiter une voix en quelques secondes et surtout de parler de manière fluide en incorporant des hésitations et même des émotions. Avec son énorme catalogue, les développeurs peuvent facilement expérimenter avec les différentes voix. A quand une nouvelle voix pour Siri ?

A emporter
▶️ Le streaming, le streaming, tout pour le streaming
✈️ Retrouvez votre playlist préférée à 40 000 pieds
📰 Apple propose Journal sur Mac et iPad
💰 Seriez-vous prêt à utiliser l’IA pour vos achats ?
L’actu Radio France
🌴 Partir par ICI : pour voyager et découvrir la France, il y a les bons plans “tourisme” qu’on voit partout dans les guides ou sur les réseaux sociaux et ceux que seuls les gens du coin connaissent. Écoutez « Partir », le podcast ICI, pour organiser vos prochains week-ends de tourisme en moins de 15 minutes.
🎾 Dans les coulisses de Roland-Garros par France Inter : installé depuis 1928 à la porte d’Auteuil à Paris, Roland-Garros a débuté le 19 mai pour son édition 2025. Il se joue sur terre battue, surface devenue la marque de fabrique du tournoi français dont France Inter vous fait découvrir les coulisses.
🪐 Les explorateurs de l’Univers par France Inter : pour la première fois depuis que l’Univers existe, un humain nous parle depuis l’autre bout du cosmos. Aidan souhaite former les enfants de la Terre au savoir d’aujourd’hui, les faire voyager dans l’espace et le temps, leur faire découvrir pourquoi les étoiles brillent, survoler les autres mondes !
🕺 Benjamin Millepied, à contre-pied de la tradition par France Musique : chorégraphe de renom, Benjamin Millepied s’est imposé sur la scène mondiale par son style audacieux et moderne. Ex-directeur de la danse à l’Opéra de Paris et fondateur du L.A. Dance Project, il bouscule les codes et repousse sans cesse les frontières du mouvement.