Google Gemini 朗读文档，AI声音随心定制

Google Docs将通过最近集成的AI驱动音频生成功能，从根本上改变用户与文档的交互方式。利用Google先进的Gemini AI，用户现在可以将书面内容转化为有声内容，提供全新的可访问性和便利性。此功能允许创建任何文档的音频版本，并配有可自定义的声音选项和可调节的播放速度，为用户带来个性化的听觉体验。

这项新功能的实用性不仅限于文档的原始创建者。共享文档的读者可以直接从Google Docs轻松访问AI生成的音频。这可以通过导航到“工具”下拉菜单，然后选择“音频”，最后选择“收听此标签页”来实现。对于希望使音频选项更加突出的作者，可以通过“插入”菜单将可自定义的音频按钮直接嵌入到文档中，让读者一键启动播放。

虽然Google早在四月份就曾暗示可以将文档转换为“AI播客”，但这次最新的推出似乎是为按需收听提供更直接、更即时的解决方案。它满足了简单地想听书面内容朗读的需求，无论是用于校对、多任务处理，还是仅仅以不同形式吸收信息。

最初，此功能仅支持英文文档，并且仅在桌面设备上可用。Google正在逐步向其特定用户群推出此功能。这包括Google Workspace的商业版、企业版和教育版计划订阅用户，以及已订阅AI Pro或Ultra级别的个人用户。这种有针对性的发布表明了战略性方法，可能旨在在更广泛部署之前收集高用量用户的反馈。

Google Docs中AI驱动音频的引入标志着人工智能持续集成到日常生产力工具中的又一个重要步骤。它强调了将数字内容变得更通用、更易于访问的更广泛行业趋势，以适应不同的学习方式和情境需求。对于专业人士、学生和普通用户而言，收听文档的能力可以通过允许在通勤、锻炼或其他不方便阅读屏幕的活动中消费信息来提高生产力。它在改进文档审阅流程和帮助视力障碍或学习差异人士方面也具有相当大的潜力。随着AI能力的不断进步，此类功能有望成为标准，重塑我们在数字时代与信息交互的方式。

Google Gemini 朗读文档，AI声音随心定制

相关文章

Xcode 26 将集成 Anthropic 的 Claude 和 Opus LLM

Meta AI配音拓展Reels创作者影响力

Meta AI为Instagram视频配音，实现唇形同步