企业AI:专用服务器缘何超越公有云?成本、安全与性能揭秘

Infoworld

一项新的行业调查显示,企业中出现了一种日益增长的趋势:它们正在为人工智能(AI)项目购买自己的硬件,而不是完全依赖公有云提供商。这一转变主要源于对成本可预测性、增强控制、强大安全性和卓越性能的担忧。

AI系统本质上是计算密集型的,在公有云环境中管理其相关成本可能极具挑战性。数据显示,这是一个普遍存在的问题,近一半的IT领导者报告称,意外的云支出在5,000美元到25,000美元之间,这通常归因于高要求的AI工作负载。这些工作负载需要大量的基于云的计算能力、存储和实时数据处理,所有这些都是动态计费的。

公有云“按使用付费”的基本承诺对AI而言可能成为一种财务负担。高性能AI系统需要Nvidia GPU或TPU等专用硬件,这些硬件租用成本高昂,如果缺乏持续的工作负载优化,可能会导致利用率不足。此外,在众多计算实例之间扩展AI任务会产生额外的网络流量、数据检索和延迟降低成本。除了直接成本,32%的IT专业人士指出,云的灵活性可能会损害可预测性,由于担心关键AI任务资源不足,导致资源利用率低下或浪费性分配,而预算紧张则加剧了这种挫败感。

相比之下,专用服务器提供了更可预测和稳定的定价模型。无论是租赁还是购买,物理服务器都能让企业完全控制硬件,消除隐藏成本和意外的月度账单。IT领导者日益认为这种模式更具成本效益,并能更好地实现明确的投资回报。

控制、安全与AI基础设施

对更高控制和更严格安全的迫切需求也正在加速私有专用服务器的采用。AI系统严重依赖数据,这些数据通常是敏感的且具有专有性。企业对将此类关键资产委托给公有云提供商变得越来越谨慎。意外数据泄露、违规或不符合数据保护法规的风险往往超过了将基础设施外包给共享公有云的感知好处。

对于金融、医疗保健和政府等高度受监管的行业,专用硬件通常是必需的。这些组织必须遵守严格的合规性要求,如HIPAA、GDPR或PCI DSS,确保其敏感数据不会跨越司法管辖区或与共享云环境中的其他租户混淆。Liquid Web的一份报告强调了这一趋势,揭示政府(93%)、IT(91%)和金融(90%)正在引领专用服务器的采用。

私有环境的另一个关键优势是它们提供的细粒度控制。AI系统经常需要IT人员微调工作流和基础设施以实现最大效率。专用服务器使组织能够为各种AI工作负载定制性能设置,从优化大规模模型训练和微调神经网络推理,到为实时应用预测创建低延迟环境。

至关重要的是,这种控制不再需要内部数据中心。托管服务提供商和主机托管设施的兴起意味着企业可以租用托管的专用硬件,将安装、安全和维护委托给专业人员。这种方法结合了通常与云相关的操作便利性,以及对计算资源更深入的可见性和更大的权限。

私有服务器的性能优势

性能是AI中的一个关键因素,其中延迟可以直接影响业务成果。许多AI系统,特别是那些涉及实时决策、推荐引擎、金融分析或自主系统的系统,需要微秒级的响应时间。公有云尽管具有可扩展性,但由于共享基础设施中的多租户以及与用户或数据源潜在的地理距离,固有地引入了延迟。

然而,专用物理服务器可以战略性地放置在更靠近数据源或驱动AI操作的用户的位置。组织可以利用主机托管服务提供商或边缘设施,将硬件放置在关键地理区域附近,从而最大限度地减少网络跳数并降低延迟。通过消除共享云网络的开销,网络性能得到进一步提升,因为在高峰期多个租户争夺资源时,这种开销可能会变得不可预测。

这种持续的高性能显著提高了将AI从实验项目扩展到任务关键型系统的可行性。此外,随着AI模型变得越来越复杂——有些现在已超过万亿参数——私有服务器提供的专门为高速计算设计的性能已变得至关重要。

混合公有-私有策略

尽管AI向私有基础设施的转变是显而易见的,但公有云仍然具有其相关性。企业继续利用公有云执行特定的AI任务,例如测试新模型、集成外部AI API或运行非关键系统。公有云在快速可扩展性方面表现出色,并可作为创新的平台,特别是在AI的迭代开发阶段。

然而,随着AI项目成熟并过渡到长期生产,对成本控制、持续合规性和最佳性能的需求通常需要不同的方法。对于许多组织而言,选择并非在公有云和私有服务器之间,而是要取得战略平衡。公有云通常最适合混合策略,其弹性补充了私有基础设施提供的稳定性和控制。

这种混合模型也考虑了私有基础设施本身的演变,通过主机托管和托管服务,企业可以无需承担构建或管理自己的数据中心的负担,即可获得专用硬件的好处。

“一切都在云中”的传统观念正在演变为一种更实用、个性化的基础设施方法。近一半(45%)的IT专业人士预计,到2030年,专用服务器将变得更加关键,从单纯的骨干网转变为AI驱动创新的关键要素。企业基础设施的未来无疑是混合的,公有云和私有服务器相互补充。虽然公有云将继续推动实验和可扩展性方面的创新,但专用服务器正重新崛起,成为一股悄然的强大力量,尤其对于成本可预测性和峰值性能至关重要的资源密集型AI系统。