DDN AI400X3 刷新MLPerf基准:AI基础设施性能新标杆

2025-08-05T08:30:00.000ZTechpark

DDN,作为全球领先的AI和数据智能解决方案提供商,近日宣布其下一代AI400X3存储设备在最新的MLPerf Storage v2.0基准测试中取得了显著成果。AI400X3由DDN的EXAScaler并行文件系统驱动,旨在大规模加速严苛的AI工作负载,在紧凑、节能的设计中提供高密度性能。

这一进步旨在为大型企业提供更快的洞察力、更低的运营成本,以及自信地扩展其AI计划的能力,同时不损害性能或可持续性。

DDN首席技术官Sven Oehme强调了支持大规模AI所需的精密工程基础设施。“大规模AI不仅仅需要蛮力,它还需要能够提供持续性能、效率和可靠性的精密工程基础设施,”他表示。“通过AI400X3,我们精确地实现了这一点。这些MLPerf结果证明,DDN能够与世界上最先进的GPU保持同步,甚至超越它们,所有这些都在紧凑、节能的占地面积内完成。我们不仅在赋能AI,更在消除阻碍其发展的瓶颈。”

MLPerf Storage基准测试是评估存储系统如何有效支持密集型AI工作负载的行业标准。DDN AI400X3在单节点和多节点配置下进行了测试,反映了从初始设置到大规模分布式AI训练的真实部署场景。值得注意的是,该系统仅使用一个紧凑的2U设备就取得了这些成果,展示了其效率和强大性能。

在MLPerf Storage 2025提交中,AI400X3展示了令人印象深刻的能力:

在单节点基准测试中,DDN AI400X3实现了:

  • Cosmoflow和ResNet50训练的最高性能密度,仅使用一个2U设备就有效支持了52个和208个模拟NVIDIA H100 GPU的数据需求。
  • 读取I/O性能达到30.6 GB/s,写入性能达到15.3 GB/s,能够在3.4秒和7.7秒内快速加载和保存Llama3-8b检查点。

在多节点基准测试中,它实现了:

  • Unet3D H100训练持续读取吞吐量超过120 GB/s。
  • 在ResNet50上支持多达640个模拟H100 GPU。
  • 在Cosmoflow上支持多达135个模拟H100 GPU。
  • 这些结果表明AI400X3的性能比去年提高了两倍。

这些基准测试结果强调了DDN AI400X3在各种AI工作负载下,即使在要求严苛的多节点训练条件下,也能保持一致的高性能。通过确保GPU通过快速可靠的数据访问得到充分利用,AI400X3加速了模型训练,并促进了频繁的检查点保存而不会降低性能。这带来了训练效率的提高、韧性的增强以及整体基础设施成本的降低。

凭借其紧凑的2U外形和低功耗,AI400X3旨在解决数据中心日益增长的空间、功耗和散热挑战,使其适用于寻求可持续扩展AI工作负载的组织。

DDN作为高性能AI和高性能计算(HPC)基础设施领域的领导者,享有长期盛誉。自2016年以来,NVIDIA一直独家依赖DDN为其内部AI集群提供支持,这突显了DDN作为推动可扩展AI创新的值得信赖的合作伙伴的作用。

通过严格的MLPerf Storage基准测试,DDN旨在为企业和AI创新者提供独立验证的数据,使他们能够以更快的速度和更大的信心构建、训练和部署AI解决方案。

DDN AI400X3 刷新MLPerf基准:AI基础设施性能新标杆 - OmegaNext AI 新闻