亚马逊Alexa+ AI升级：智能助手真的变聪明了吗？

亚马逊的虚拟助手Alexa长期以来一直是智能家居的必备品，主要用于播放音乐、设置计时器和提供天气预报等简单任务。然而，生成式人工智能的出现，特别是自2023年以来ChatGPT等系统所展现出的流畅对话能力，预示着语音助手不可避免的进化。亚马逊也对此表示认同，并着手进行一项雄心勃勃的多年努力，旨在为Alexa注入一个全新的AI大脑，该大脑基于驱动尖端聊天机器人的相同大型语言模型（LLM）构建。这项大规模的改革，据报道充满了内部斗争和技术复杂性，最终促成了Alexa+的诞生，在经过一段早期访问测试后，现正更广泛地推出。

Alexa+代表了亚马逊将生成式AI的动态对话能力与定义了原始Alexa的可靠日常功能融合的重大尝试。Prime会员将免费获得Alexa+的访问权限，而非Prime订阅者则需每月支付19.99美元的费用。此次推出恰逢亚马逊最近与《纽约时报》签订许可协议，允许这家科技巨头将《时报》内容整合到其AI系统中，包括Alexa+。（值得注意的是，《纽约时报》正同时因AI训练数据相关的涉嫌版权侵权问题，对OpenAI和微软提起法律诉讼。）

对Alexa+的初步测试显示，它进步与显著退步并存。从积极的方面看，与新版Alexa的互动无疑更具吸引力。其合成语音更加逼真，展现出类似人类的语调，用户可以从八种不同的声音配置文件中选择。该系统还引入了令人印象深刻的新功能，例如预订餐厅和为儿童生成并叙述长篇故事。至关重要的是，Alexa+擅长处理多步骤请求，能够熟练处理复杂命令，例如同时设置多个计时器或起草并发送旅行行程。一个显著的生活质量改进是消除了对唤醒词的持续需求，从而实现了更自然、连续的对话和后续问题。

尽管取得了这些可喜的进步，Alexa+目前却饱受阻碍其可靠性的错误和不一致性困扰。在测试中，它不仅落后于其他AI语音助手，在某些情况下，甚至在基本功能上表现不如原始Alexa。例如，一个取消闹钟的简单命令（对旧系统而言是常规任务）却莫名其妙地被忽略了。尝试让Alexa+总结一篇通过电子邮件发送给它的研究论文时，却收到了文档无法找到的错误消息。更令人担忧的是事实性错误，或“幻觉”，例如错误识别Wirecutter推荐的盒式刨丝器。在一个令人难忘的互动中，当被要求协助进行技术安装时，Alexa+变得慌乱，并重复说：“哦，不，我的线路搭错了。”此外，一些宣传的功能，例如用于个性化问候的存在感应例程，在测试期间尚未激活。亚马逊负责Alexa和Echo的副总裁Daniel Rausch承认了这些缺点，并表示随着系统规模的扩大，公司“还有一些棱角需要打磨”。

Rausch详细阐述了将生成式AI整合到Alexa中的深刻技术挑战。原始Alexa建立在确定性的、基于规则的架构上，其中每个功能——从播放歌曲到控制智能设备——都需要单独编程和特定的工具调用。相比之下，大型语言模型是“随机的”，基于概率运行，这赋予了它们创造力，但也牺牲了旧系统固有的可靠性。这种根本性的差异使得许多核心流程需要完全重建。早期的内部演示显示出显著的延迟，Alexa+需要30多秒才能响应播放歌曲之类的简单请求——这是一种“令人痛苦的”延迟。早期LLM的冗长性也带来了挑战；询问计时器可能会引出一篇关于厨房计时器历史的500字文章。亚马逊的解决方案涉及一个编排系统，该系统智能地将用户请求路由到70多个AI模型的组合中，其中包括亚马逊的专有模型和Anthropic的Claude等外部提供商，旨在将对话流畅性与可预测的结果相结合。

另一个障碍是用户适应。长期使用Alexa的用户已经形成了一种特定的“Alexa习惯用法”，以系统能理解的熟悉命令来措辞请求。而Alexa+，旨在实现更流畅、更像人类的对话，需要一种不同的交互方式，要求用户摒弃旧习惯。虽然技术障碍是巨大的，并且包括苹果Siri在内的任何竞争对手都尚未完全破解这一难题，但Alexa+的局限性并非固有地否定了生成式AI在语音助手方面的潜力。相反，它们突显了将尖端AI与已建立的传统系统集成所面临的巨大困难。目前，许多用户可能会发现自己，就像这位评论员一样，选择恢复到旧的、更可预测的Alexa版本，将广泛的测试留给他人。最终，对于AI而言，正如对于人类智能一样，原始能力往往不如其实用和可靠的应用重要。

亚马逊Alexa+ AI升级：智能助手真的变聪明了吗？

相关文章

小说《同情之塔东京》：寓言探索东京的AI、身份与ChatGPT

特斯拉在中国为Model 3推出转向灯拨杆改装件：重回传统？

Windows 11 秘籍：掌握新功能与 Copilot AI