机器人AI互编大脑:迈向“终结者”的危险一步

Theregister

计算机科学家彼得·伯克展示了人工智能领域的重大飞跃,揭示了机器人现在能够利用先进的生成式AI模型来编程其他机器人的“大脑”。这项开创性工作在一篇近期发表的预印本论文中详细阐述,标志着向科幻小说中常设想的未来迈出了可识别的一步——机器将拥有自我复制和进化自身智能的能力。

伯克是加州大学欧文分校电气工程与计算机科学教授,他在研究开篇坦率地提及了虚构的“终结者”场景,即自我意识机器人掌控一切。在承认这一引人注目的相似之处的同时,他也表达了对这种结果永不实现的强烈希望,这种情感在军事领域对AI技术日益增长的兴趣中尤为相关。

该项目以两种截然不同的方式定义了“机器人”。第一个“机器人”包括各种生成式AI模型,如Claude、Gemini和ChatGPT,它们在本地笔记本电脑和云端运行。这些模型被赋予了编程第二个“机器人”的任务——一架配备紧凑型树莓派Zero 2 W电路板的无人机,旨在承载其控制系统。传统上,无人机的地面控制系统(GCS)负责实时地图绘制、任务规划和配置,它位于地面计算机上,通过无线链路与无人机通信。伯克的创新表明,生成式AI可以为无人机编写所有必要的代码,使其在飞行时作为网络服务器托管自己的GCS,并通过互联网访问。

开发过程涉及一系列密集的“冲刺”,利用不同的AI模型和集成开发环境(IDE),如VS Code、Cursor和Windsurf。早期的尝试,例如与Claude的首次冲刺,遇到了限制,AI模型在大约十几个提示后达到了其“上下文窗口”容量,有效地失去了对正在进行的对话的追踪。随后与Gemini和Cursor的努力也面临障碍,包括脚本错误以及为适应模型限制而需要进行大量代码重构。

最终,使用Windsurf AI IDE的第四次冲刺取得了成功。这个由AI生成的无人机控制系统,或称WebGCS,在两周半的时间内需要大约100小时的人工监督,最终生成了10,000行代码。这代表了显著的效率提升,比伯克估计的类似人类开发项目Cloudstation所需的工时少了大约20倍,后者花费了他和一组学生四年时间才创建完成。

伯克工作中的一个关键观察是当前AI模型的局限性,它们似乎难以有效处理和生成超过10,000行代码。这一发现与最近的其他研究一致,例如S. Rando等人的一项研究指出,随着上下文长度的增加,Claude 3.5 Sonnet等模型的准确性显著下降。伯克的经验表明,大约一行代码相当于10个“令牌”(AI模型处理的信息单位),这突出了当前生成式AI在大规模代码生成方面的实际天花板。

空间数据公司Geolava的首席执行官Hantz Févry赞扬了这项无人机项目“引人入胜”,指出它与新兴的空间智能领域高度契合。他强调,无人机通过生成式AI自主构建其指挥和控制中心的概念不仅雄心勃勃,也预示着未来的趋势。然而,Févry也强调了“严格的安全检查和边界”的关键需求,伯克的论文部分解决了这一担忧,其中提到了在无人机操作期间,保留了一个冗余的人工控制发射器以进行手动覆盖。

Févry进一步阐述了对航空影像行业的更广泛影响,指出自主捕获正在从一种奢侈品转变为空间AI的一个基本方面,无论是来自无人机、平流层平台还是低地球轨道卫星。他相信像伯克这样的系统预示着一个未来,其中传感、规划和推理能力将近乎实时地无缝融合,并指出像Skydio这样的平台已经正在重塑环境理解。Févry总结道,这类AI系统的最终考验将是它们在对抗性或模糊的真实世界环境中导航和适应的能力,这暗示着一个“可泛化自主性”的未来,而不仅仅是任务特定的机器人技术。