Entre harmonie et prudence : l’avenir de l’IA dans l’ère de l’audio
17 mai 2024 par Matthieu Batard

Entre harmonie et prudence : l’avenir de l’IA dans l’ère de l’audio

La newsletter de la radio de demain #344… Abonnez-vous

L’intelligence artificielle ne cesse d’évoluer et de se transformer, et avec le lancement de GPT-4o par OpenAI et l’arrivée de Claude en Europe par Anthropic, nous assistons à une étape décisive dans la manière dont l’IA peut être utilisée de manière durable et responsable. Ces développements mettent en lumière l’importance croissante de l’audio dans les technos d’IA, ouvrant de nouvelles perspectives passionnantes pour son application. 

L’Audio : un vecteur clé dans l’évolution de l’IA

Les assistants vocaux comme Siri, Alexa, et Google Assistant ont ouvert la voie, et des modèles comme GPT-4o promettent d’élever ces interactions à un niveau supérieur. L’intégration de l’audio dans les modèles d’IA comme GPT-4o représente une avancée majeure. Cela permet aux utilisateurs de communiquer avec l’IA par la voix, ce qui est non seulement plus naturel mais aussi plus accessible pour de nombreuses personnes. Par exemple, le temps de réponse de GPT-4o aux entrées audio, d’environ 232 millisecondes, est comparable à celui d’une conversation humaine, rendant les interactions fluides et instantanées. 

Les applications de l’audio en IA sont vastes et variées. Elles peuvent aller de l’assistance personnelle à l’éducation, en passant par le support client et les services médicaux. Par exemple, un assistant IA capable de comprendre et de répondre rapidement aux commandes vocales peut grandement améliorer l’expérience utilisateur et augmenter l’efficacité dans des contextes professionnels et personnels. Ces interactions humain-machine  plus dynamiques et humaines, rappellent pour certains celles vues dans des films comme Her (Spike Jonze, 2013), cependant d’autres y voient une réminiscence du Maschinenmensch de Metropolis (Fritz Lang, 1927), soulignant les craintes profondes entourant l’automatisation et l’intimité artificielle. 

Le Watermarking, la solution pour naviguer sur les flots de l’IA ?

À mesure que l’IA devient capable de générer du contenu de plus en plus réaliste, la nécessité de distinguer ce qui est généré par l’IA de ce qui est créé par des humains devient cruciale. Google a présenté cette semaine SynthID, un outil de watermarking pour les contenus générés par l’IA, qui permet de marquer les textes, images et vidéos de manière imperceptible (à quand l’audio ?). Cet outil aiderait ainsi à prévenir la diffusion de désinformations et à protéger la propriété intellectuelle. Le watermarking fonctionne en introduisant des informations supplémentaires dans le processus de génération des contenus, ajustant légèrement la probabilité des choix de mots ou des éléments visuels pour créer une signature unique. Cette technique permet ainsi de détecter si un contenu a été généré par une IA, même après des modifications mineures, garantissant ainsi une certaine transparence et traçabilité. 

Bien que le watermarking ne soit pas une solution parfaite, il constitue un pas important vers la gestion des risques liés à l’utilisation malveillante de l’IA. En combinant cette technologie avec d’autres approches de détection, il est possible de créer des systèmes plus robustes pour identifier les contenus générés par l’IA et prévenir les abus. Un outil qui rendra bien service aux médias puisqu’il permettra aux consommateurs de contenus de distinguer le travail journalistique du contenu généré automatiquement.

Cette semaine

Apple News Plus est prêt à fonctionner hors ligne
En savoir plus

Les fuites de Spotify suggèrent que l’audio lossless est presque prêt 
En savoir plus

Un tiers des Américains écoutent des podcasts chaque semaine
En savoir plus

Panorama des médias sociaux 2024
En savoir plus

En bref @ Radio France

Les voix du Commando Kieffer | France Bleu : les « Kieffer », ce sont 177 hommes, réunis autour du Commandant Philippe Kieffer, qui s’entraînent depuis plusieurs années déjà pour devenir des soldats d’élite et être prêts pour leur D-Day, pour le Débarquement en Normandie.
En savoir plus

Xi Jinping, le prince rouge | France Inter : Par Dominique André. Comment l’histoire de la Chine a façonné le parcours de Xi Jinping ? Comment a-t-il gravi les échelons du Parti communiste chinois jusqu’au poste suprême ?
En savoir plus

Doruido, le premier manga audio | France Culture : inspiré par le genre du shonen japonais, le manga audio « Doruido » met en scène Ayden, Liv et Od’, des apprentis druides dans un monde celtique médiéval. Épique, comique, gore ou même kawaii : plongez dans l’aventure sonore. Une série écrite par Élie Olivennes, réalisée par Christophe Hocké.
En savoir plus

Les Odyssées des musées d’Orsay et de l’Orangerie | France Inter : le 15 avril 1874 ouvrait la première exposition impressionniste. Le musée d’Orsay, qui abrite la plus importante collection d’œuvres de ce mouvement, célèbre ce 150eme anniversaire. L’occasion de remonter le temps à la rencontre de quelques unes des figures du mouvement
En savoir plus