亚马逊Alexa+ AI升级:智能助手真的变聪明了吗?

Indianexpress

亚马逊的虚拟助手Alexa长期以来一直是智能家居的必备品,主要用于播放音乐、设置计时器和提供天气预报等简单任务。然而,生成式人工智能的出现,特别是自2023年以来ChatGPT等系统所展现出的流畅对话能力,预示着语音助手不可避免的进化。亚马逊也对此表示认同,并着手进行一项雄心勃勃的多年努力,旨在为Alexa注入一个全新的AI大脑,该大脑基于驱动尖端聊天机器人的相同大型语言模型(LLM)构建。这项大规模的改革,据报道充满了内部斗争和技术复杂性,最终促成了Alexa+的诞生,在经过一段早期访问测试后,现正更广泛地推出。

Alexa+代表了亚马逊将生成式AI的动态对话能力与定义了原始Alexa的可靠日常功能融合的重大尝试。Prime会员将免费获得Alexa+的访问权限,而非Prime订阅者则需每月支付19.99美元的费用。此次推出恰逢亚马逊最近与《纽约时报》签订许可协议,允许这家科技巨头将《时报》内容整合到其AI系统中,包括Alexa+。(值得注意的是,《纽约时报》正同时因AI训练数据相关的涉嫌版权侵权问题,对OpenAI和微软提起法律诉讼。)

对Alexa+的初步测试显示,它进步与显著退步并存。从积极的方面看,与新版Alexa的互动无疑更具吸引力。其合成语音更加逼真,展现出类似人类的语调,用户可以从八种不同的声音配置文件中选择。该系统还引入了令人印象深刻的新功能,例如预订餐厅和为儿童生成并叙述长篇故事。至关重要的是,Alexa+擅长处理多步骤请求,能够熟练处理复杂命令,例如同时设置多个计时器或起草并发送旅行行程。一个显著的生活质量改进是消除了对唤醒词的持续需求,从而实现了更自然、连续的对话和后续问题。

尽管取得了这些可喜的进步,Alexa+目前却饱受阻碍其可靠性的错误和不一致性困扰。在测试中,它不仅落后于其他AI语音助手,在某些情况下,甚至在基本功能上表现不如原始Alexa。例如,一个取消闹钟的简单命令(对旧系统而言是常规任务)却莫名其妙地被忽略了。尝试让Alexa+总结一篇通过电子邮件发送给它的研究论文时,却收到了文档无法找到的错误消息。更令人担忧的是事实性错误,或“幻觉”,例如错误识别Wirecutter推荐的盒式刨丝器。在一个令人难忘的互动中,当被要求协助进行技术安装时,Alexa+变得慌乱,并重复说:“哦,不,我的线路搭错了。”此外,一些宣传的功能,例如用于个性化问候的存在感应例程,在测试期间尚未激活。亚马逊负责Alexa和Echo的副总裁Daniel Rausch承认了这些缺点,并表示随着系统规模的扩大,公司“还有一些棱角需要打磨”。

Rausch详细阐述了将生成式AI整合到Alexa中的深刻技术挑战。原始Alexa建立在确定性的、基于规则的架构上,其中每个功能——从播放歌曲到控制智能设备——都需要单独编程和特定的工具调用。相比之下,大型语言模型是“随机的”,基于概率运行,这赋予了它们创造力,但也牺牲了旧系统固有的可靠性。这种根本性的差异使得许多核心流程需要完全重建。早期的内部演示显示出显著的延迟,Alexa+需要30多秒才能响应播放歌曲之类的简单请求——这是一种“令人痛苦的”延迟。早期LLM的冗长性也带来了挑战;询问计时器可能会引出一篇关于厨房计时器历史的500字文章。亚马逊的解决方案涉及一个编排系统,该系统智能地将用户请求路由到70多个AI模型的组合中,其中包括亚马逊的专有模型和Anthropic的Claude等外部提供商,旨在将对话流畅性与可预测的结果相结合。

另一个障碍是用户适应。长期使用Alexa的用户已经形成了一种特定的“Alexa习惯用法”,以系统能理解的熟悉命令来措辞请求。而Alexa+,旨在实现更流畅、更像人类的对话,需要一种不同的交互方式,要求用户摒弃旧习惯。虽然技术障碍是巨大的,并且包括苹果Siri在内的任何竞争对手都尚未完全破解这一难题,但Alexa+的局限性并非固有地否定了生成式AI在语音助手方面的潜力。相反,它们突显了将尖端AI与已建立的传统系统集成所面临的巨大困难。目前,许多用户可能会发现自己,就像这位评论员一样,选择恢复到旧的、更可预测的Alexa版本,将广泛的测试留给他人。最终,对于AI而言,正如对于人类智能一样,原始能力往往不如其实用和可靠的应用重要。