DeepFleet:亚马逊AI模型预测机器人交通,提升效率
亚马逊已达成一个重要里程碑,在全球配送和分拣中心部署了其第一百万台机器人,巩固了其作为世界最大工业移动机器人运营商的地位。这一显著扩张恰逢DeepFleet的推出,这是一套开创性的AI基础模型套件,旨在增强这些庞大机器人车队之间的协调。这些模型通过数十亿小时的真实操作数据训练,旨在优化机器人移动、显著减少拥堵并将整体效率提升高达10%。
基础模型概念在语言和视觉AI领域获得了广泛关注,它涉及训练海量数据集以学习通用模式,然后这些模式可以适应多种特定任务。亚马逊现在将这种强大的方法应用于机器人技术,在动态仓库环境中协调数千台机器人所面临的挑战,需要远超传统模拟所能提供的预测智能水平。在配送中心,机器人对于将库存货架运送给人类工人至关重要;而在分拣设施中,它们高效处理用于交付的包裹。当车队数量达到数十万时,交通堵塞和死锁等操作瓶颈很常见,会减慢整个流程。DeepFleet通过精确预测机器人轨迹和交互,从而实现主动规划和干预,直接解决了这些问题。
这些模型利用了极其丰富和多样的数据集,涵盖了数百万机器人小时的数据,包括各种仓库布局、机器人代系和操作周期。这些广泛的数据使DeepFleet能够捕捉复杂的突发行为,例如拥堵波,并像大型语言模型适应新查询一样,在不同场景中进行泛化。
DeepFleet建立在四种不同的模型架构之上,每种架构都采用独特的方法来理解多机器人动态。例如,以机器人为中心(RC)的模型就像一个专注的观察者,根据本地邻域数据(如附近的机器人、物体和标记)预测单个机器人的行动。尽管其参数量相对适中,为9700万,但该模型在评估中在位置和状态预测方面表现出卓越的准确性。相比之下,机器人-地面(RF)模型采取了更广阔的视角,将单个机器人状态与全局地面特征(如顶点和边缘)相结合,实现同步预测,平衡了局部交互与仓库范围内的上下文。这个拥有8.4亿参数的更大模型在时间预测方面表现出色。第三种方法,图像-地面(IF)模型,试图将仓库可视化为多通道图像,使用卷积编码获取空间特征,但其表现不佳,可能是由于难以大规模捕捉精确的像素级机器人交互。最后,图-地面(GF)模型提供了一种计算效率高的解决方案,将仓库地面表示为时空图。这使其能够高效处理全局关系,仅用1300万参数就能预测行动和状态,使其精简且极具竞争力。这些设计各异,在时间(同步与事件驱动)和空间(局部与全局)方法上有所不同,使亚马逊能够测试哪种方法最适合大规模预测。
对未见仓库数据进行的性能评估使用了动态时间规整(DTW)衡量轨迹准确性,以及拥堵延迟误差(CDE)衡量操作真实性。RC模型总体表现领先,位置DTW得分为8.68,CDE为0.11%,而GF模型则在计算复杂度显著降低的情况下取得了强劲结果。扩展实验进一步证实,在更广泛数据集上训练的更大模型能持续减少预测损失,这与其他基础模型中观察到的趋势相符。对于GF模型,推断表明,一个拥有10亿参数、在660万个片段上训练的版本可以实现最佳计算效率。这种可扩展性是一个关键优势,因为亚马逊庞大的机器人车队提供了无与伦比的操作数据量。DeepFleet的早期应用包括拥堵预测和自适应路由,未来潜力延伸至自动化任务分配和死锁预防。
DeepFleet已对亚马逊的全球网络产生切实影响,该网络覆盖全球300多个设施,包括最近在日本的部署。通过提高机器人行驶效率,该技术直接有助于加快包裹处理速度和降低运营成本,最终造福客户。除了效率之外,亚马逊还强调其对员工队伍发展的承诺,自2019年以来已对超过70万名员工进行了机器人和AI相关角色的技能提升。这种整合旨在通过将体力要求高的任务分流给机器来创造更安全的工作岗位。
随着亚马逊继续完善DeepFleet,重点关注其最有前景的RC、RF和GF变体,这项技术有望重新定义物流及其他领域的多机器人系统。通过利用先进AI预测车队行为,DeepFleet超越了反应式控制,为更自主和可扩展的操作铺平了道路。这项创新强调了基础模型如何将其影响力从纯粹的数字领域扩展到物理自动化,有望改变依赖协调机器人技术的行业。