Google Gemini: Vos Docs Parlent Maintenant avec des Voix IA Personnalisables

Theverge

Google Docs est sur le point de changer fondamentalement la façon dont les utilisateurs interagissent avec leurs documents, grâce à l’intégration récente d’une fonctionnalité de génération audio basée sur l’IA. En exploitant l’IA Gemini avancée de Google, les utilisateurs peuvent désormais transformer le contenu écrit en paroles, offrant une nouvelle dimension d’accessibilité et de commodité. Cette capacité permet la création d’une version audio de n’importe quel document, avec des options vocales personnalisables et des vitesses de lecture réglables, offrant une expérience d’écoute personnalisée à portée de main de l’utilisateur.

L’utilité de cette nouvelle fonctionnalité s’étend au-delà du créateur original du document. Les lecteurs de documents partagés peuvent accéder sans effort à l’audio généré par l’IA directement depuis Google Docs. Cela se fait en naviguant dans le menu déroulant “Outils”, puis en sélectionnant “Audio”, et enfin “Écouter cet onglet”. Pour les auteurs qui souhaitent rendre l’option audio encore plus visible, un bouton audio personnalisable peut être directement intégré au document via le menu “Insertion”, permettant aux lecteurs de lancer la lecture en un seul clic.

Bien que Google ait précédemment fait allusion à la possibilité de convertir des documents en “podcasts IA” en avril, ce dernier déploiement semble être une solution plus directe et immédiate pour l’écoute à la demande. Il répond au simple besoin d’entendre le contenu écrit lu à voix haute, que ce soit pour la relecture, le multitâche ou simplement l’absorption d’informations sous un format différent.

Initialement, la fonctionnalité ne prend en charge que les documents en anglais et est exclusivement disponible sur les appareils de bureau. Google déploie progressivement cette fonctionnalité auprès d’un sous-ensemble spécifique de sa base d’utilisateurs. Cela inclut les abonnés Google Workspace aux forfaits Business, Enterprise et Education, ainsi que les personnes qui se sont abonnées aux niveaux AI Pro ou Ultra. Ce déploiement ciblé suggère une approche stratégique, visant probablement à recueillir les commentaires des utilisateurs à fort volume avant un déploiement plus large.

L’introduction de l’audio basé sur l’IA dans Google Docs marque une autre étape significative dans l’intégration continue de l’intelligence artificielle dans les outils de productivité quotidiens. Elle souligne une tendance industrielle plus large visant à rendre le contenu numérique plus polyvalent et accessible, répondant à divers styles d’apprentissage et besoins situationnels. Pour les professionnels, les étudiants et les utilisateurs en général, la capacité d’écouter des documents peut améliorer la productivité en permettant la consommation d’informations pendant les trajets, les entraînements ou d’autres activités où la lecture sur un écran est peu pratique. Elle présente également un potentiel considérable pour améliorer les processus de révision de documents et aider les personnes atteintes de déficiences visuelles ou de troubles d’apprentissage. À mesure que les capacités de l’IA continuent de progresser, de telles fonctionnalités sont appelées à devenir la norme, remodelant la façon dont nous interagissons avec l’information à l’ère numérique.