苹果All-in押注AI Siri:重塑语音交互,剑指应用未来
尽管苹果最近在年度全球开发者大会(WWDC)上以其iOS、macOS和watchOS等软件平台的全新“液态玻璃”设计美学吸引了众多观众,但这家科技巨头最重要的战略重点却另有他处。据报道,在光鲜亮丽的界面背后,苹果正全力押注于一次彻底改造Siri的行动,旨在将其饱受诟病的语音助手转变为一个强大的、由AI驱动的指挥中心。
据彭博社(Bloomberg)消息灵通的苹果记者马克·古尔曼(Mark Gurman)报道,该公司正投入大量资源开发一个“超强版”Siri,大幅提升其语音控制能力。这项举措旨在纠正用户多年来的不满。目前,Siri的性能出了名的不稳定,经常无法执行简单的命令或准确回答基本问题,导致许多人认为其底层智能随时间推移而退化。新版AI驱动Siri的目标是最终兑现其在应用程序内实现无缝语音控制交互的长期承诺。
想象一下,无需通过旨在最大化屏幕时间的迷宫般菜单进行点击和滑动,只需通过语音即可导航复杂的应用程序界面。古尔曼的报道表明,这正是苹果的愿景。用户可以指示Siri执行复杂的任务,例如查找、编辑和发送特定照片,评论Instagram帖子,在购物应用中滚动浏览并将商品添加到购物车,甚至登录服务——所有这些都无需触碰屏幕。从本质上讲,这个高级版Siri将能够以人类用户的精确性和细微差别,直接在其原生界面内操作应用程序。
这一转变标志着对十多年来主导移动计算的以触摸屏为中心的交互模式的深刻背离。2011年Siri首次在iPhone 4S上推出时,它预示着大规模语音控制数字助手的黎明。然而,在随后的近15年里,苹果一直难以将Siri发展到基本功能之外,甚至去年的一次改造也处理不当,过早地宣布了尚未实现的AI功能。
尽管过去曾有失误,但这款新的语音控制Siri如今在苹果内部被视为“重中之重”。如果成功实施,它可能将公司推向当前正在重塑消费科技的人工智能革命的最前沿。然而,实现能够持续执行复杂命令的完美语音控制是一项巨大的技术挑战。古尔曼指出,苹果计划谨慎推出Siri的增强语音功能,同时在春季进行更广泛的基础设施改造。内部担忧依然存在,据报道,工程师们正在努力确保系统与足够数量的应用程序兼容,以及其在高风险场景中的准确性。特别令人担忧的是,在精度不容妥协的领域,如健康或银行应用中,可能出现故障。
苹果对智能语音助手的追求,与亚马逊(Amazon)的Alexa和谷歌(Google)的Assistant等科技巨头长达十年、旨在实现《星际迷航》(Star Trek)中设想的未来“电脑”和“通讯器”设备的探索如出一辙。尽管这些助手最初在设置计时器、播放音乐或查看天气等基本任务上展现出潜力,但当它们面临在传统移动应用中效率更高的更具体或更复杂操作时,其能力往往会受挫。业界已经看到了这些限制的突出例子,包括据报道谷歌Assistant无法持续控制智能家居设备,导致潜在的集体诉讼。
由AI驱动、语音控制的Siri不仅会惠及iPhone和iPad,还会惠及整个苹果生态系统。Mac等大屏幕设备的生产力将得到提升,而Apple Watch等触摸屏输入笨拙的小屏幕设备将变得更易于访问。即使是Apple TV和HomePod等无触控或无屏幕设备也将从中受益匪浅,有望实现真正直观的语音驱动计算机的长期梦想。
苹果每个季度继续销售大量硬件,但要达到新的高度——推动未来设备更大的销量并重申其作为科技行业所期待的开创性创新者的地位——它必须掌握这些新的语音控制。公司不能在这一代Siri上止步不前。失败的后果可能是破坏性的,可能将消费者推向替代的AI解决方案,包括OpenAI正在开发的那些,以及备受期待的、涉及前苹果设计主管乔尼·艾维(Jony Ive)和OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)的AI硬件合资企业。