Pocket FM lance CoPilot IA pour des histoires audio plus rapides et captivantes

Techcrunch

La plateforme de séries audio indienne Pocket FM avance rapidement dans son ambition de devenir le “Netflix de l’audio”, en tirant parti de l’intelligence artificielle pour accélérer la création de contenu et adapter les récits aux diverses préférences des utilisateurs. La startup, soutenue par Lightspeed, équipe ses auteurs d’un ensemble sophistiqué d’outils d’IA conçu pour améliorer l’efficacité et l’engagement de la narration.

Pocket FM a déjà intégré l’IA pour des tâches fondamentales, telles que la génération de voix à l’aide de technologies comme ElevenLabs, et a piloté en interne l’assistance IA pour l’écriture et l’adaptation. Désormais, l’entreprise déploie ces outils d’IA avancés, notamment un système surnommé CoPilot, à tous ses auteurs. Selon Rohan Nayak, fondateur de Pocket FM, l’objectif principal est de réduire significativement le temps nécessaire pour terminer les épisodes.

CoPilot offre une gamme de fonctionnalités pour rationaliser le processus créatif. Il peut transformer l’écriture narrative en segments centrés sur le dialogue, effectuer une “analyse de rythme” pour sculpter des histoires afin d’obtenir un engagement maximal dans des genres audio spécifiques, et fournir des aides à l’écriture de base de type chatbot comme “raccourcir”, “développer” et la génération de texte basée sur des invites. Le développement de CoPilot a impliqué l’analyse de milliers d’heures de données d’engagement utilisateur pour discerner ce qui captive les audiences dans des intrigues et des genres particuliers. Cette analyse a éclairé des fonctionnalités qui suggèrent d’augmenter les conflits de personnages, de recommander des fins d’épisode plus excitantes, et même de proposer des balises pour les effets audio de fond. L’outil génère également automatiquement des biographies de personnages, décrit les relations et résume les points clés de l’intrigue à travers les épisodes, servant de référence complète pour les créateurs. De plus, CoPilot inclut une fonction de révision qui vérifie la cohérence de l’intrigue, la grammaire et offre des retours qualitatifs. Pour étayer les capacités de CoPilot, Pocket FM entraîne des modèles d’IA plus petits pour maintenir le contexte de l’histoire, les arcs de personnages et la cohérence narrative, tout en utilisant également les signaux des utilisateurs pour insuffler plus de drame dans les intrigues.

Au-delà de la création de contenu, Pocket FM utilise l’IA pour l’expansion internationale et la localisation. Ses outils d’adaptation ne se contentent pas de traduire du texte, mais modifient également culturellement les noms et les phrases pour qu’ils résonnent avec les publics régionaux. Cette suite, initialement intégrée à CoPilot, a été testée en Allemagne plus tôt cette année après que l’entreprise ait rencontré des difficultés à engager les utilisateurs européens l’année précédente. Nayak rapporte un succès significatif de cet essai, avec des revenus mensuels in-app en Allemagne en augmentation constante, dépassant les 700 000 $ en juin. Cette approche axée sur l’IA a considérablement réduit le temps nécessaire à Pocket FM pour établir une présence significative sur de nouveaux marchés – de 12-18 mois à moins de trois mois, leur permettant de construire rapidement le volume de contenu nécessaire. Sur le marché allemand, l’outil a augmenté la productivité des auteurs jusqu’à 50 % en termes de production de séries, conduisant à des brouillons plus exempts d’erreurs et à une meilleure rétention des utilisateurs. Aux États-Unis, les séries assistées par l’IA représentent désormais 10 % du temps de lecture total, générant 7 millions de dollars de revenus au cours des 12 derniers mois tout en réduisant les coûts de production de deux à trois fois.

L’adoption de l’IA a permis à Pocket FM de développer la génération de contenu à un rythme sans précédent, en lançant près de 1 000 émissions pilotes par mois, le volume même augmentant la probabilité de produire des succès. L’entreprise explore également de nouveaux formats, y compris la conversion d’histoires en bandes dessinées via sa plateforme Pocket Toons, et potentiellement l’aventure dans la vidéo. Avec plus de 196 millions de dollars de financement, Pocket FM expérimente également une application de micro-drames. D’ici l’année prochaine, l’entreprise prévoit de lancer son propre grand modèle linguistique (LLM) propriétaire, entraîné sur ses vastes données d’émissions, qui intégrera toutes ses fonctionnalités d’IA, éliminant le besoin de nombreux modèles plus petits et spécialisés.

Cependant, l’intégration rapide de l’IA n’a pas été sans défis. Pocket FM a procédé à plusieurs séries de licenciements impliquant des employés et des contractuels au cours de la dernière année. Il y a également eu des rapports de rendements décroissants pour les auteurs, et l’entreprise est actuellement confrontée à des poursuites en Californie concernant des problèmes d’emploi et de salaires. Un représentant de l’entreprise a déclaré que l’IA avait eu un “impact minimal sur notre communauté créative principale”, ouvrant plutôt “de nouvelles voies pour étendre la portée et la production”.

Des préoccupations persistent également concernant la qualité du contenu. Bien que Pocket FM mesure la qualité par les taux de rétention, il existe un risque de “brouillon IA” – contenu de basse qualité généré par l’IA – infiltrant la plateforme, affectant potentiellement les recommandations des utilisateurs et la découverte d’histoires de qualité. Pocket FM rétorque que son cadre de modération basé sur l’IA examine chaque élément de contenu pour la qualité et l’originalité, vérifiant la duplication, les problèmes de droits d’auteur et la santé globale du contenu avant publication. Ils affirment que l’engagement des utilisateurs détermine finalement le succès d’une émission, indépendamment de l’assistance de l’IA. Un autre piège potentiel est que les auteurs deviennent trop dépendants de l’IA. En Allemagne, l’IA contribue déjà plus de contenu par émission que les auteurs humains pour certains titres. À mesure que Pocket FM déploie davantage d’outils d’IA, le volume de contenu écrit par l’IA pourrait augmenter, augmentant potentiellement la pression pour produire plus d’émissions. Si l’adoption par les utilisateurs ne suit pas le rythme, les rendements moyens pour les auteurs pourraient diminuer. Bien que l’entreprise n’ait pas directement abordé les questions concernant les rendements décroissants, un porte-parole a souligné que les outils d’IA accélèrent l’édition et le raffinement basés sur les retours de l’audience, permettant des améliorations ciblées plutôt que des réécritures complètes. Cette approche, suggèrent-ils, “déplace le rôle de l’auteur vers l’édition, le raffinement et l’orientation d’une production plus productive”, sans nécessairement diluer la qualité.