AI的未来:产学研政联手,加速科学发现突破
万亿参数联盟(Trillion Parameter Consortium)的TPC25大会最近在加利福尼亚州圣何塞召开,汇聚了来自工业界、学术界和政府的领导者,共同探讨AI的未来,特别是其在科学和技术计算中的应用。尽管近期AI的许多进展是由大型私营科技公司推动的,但此次大会强调了一种合作努力,旨在利用这些进步促进更广泛的科学发现,造福美国和全人类。
7月30日,由密歇根大学的Karthik Duraisamy主持的一场小组讨论,探讨了各利益相关方如何协作利用AI实现科学突破。小组成员包括来自美国能源部(DOE)、一家量子计算平台开发商、一家数据管理解决方案提供商、美国国家科学基金会(NSF)以及英特尔实验室的代表。
美国能源部计算科学研究与伙伴关系司司长Hal Finkel强调了该部门对AI长期而深远的承诺。Finkel指出:“能源部的各个部门都对AI抱有浓厚兴趣”,并提到在该领域的大量投资。他详细阐述了能源部如何探索利用AI加速跨学科的科学生产力,涵盖从聚变能、超导体到先进机器人和光子学等领域。Finkel强调了能源部在超级计算方面的广泛专业知识,包括国家实验室的百亿亿次级系统,以及他们对AI测试平台和新兴技术(如类脑计算)的投资,后者有望为边缘AI应用和嵌入式实验系统带来更高的能源效率。
量子计算平台开发商Quantinuum的业务发展执行官Vishal Shrotriya展望了量子计算机与AI算法相结合的未来,将能解决材料科学、物理和化学领域复杂的计算问题。Shrotriya认为,量子计算机可以通过精确模拟小分子和生成新的合成数据来彻底改变分子科学。这些合成数据随后可以反馈给AI模型,形成一个强大的反馈循环,以加速科学发现和创新,特别是在药物开发等领域,从而超越试错法,实现分子相互作用的精确计算。
Hammerspace全球营销主管Molly Presley强调了数据在AI生态系统中的关键作用。她指出,尽管数据至关重要,但其分布和可访问性不均。Hammerspace旨在弥合人类对数据的理解与其实际表现之间的差距,促进更广泛的访问。Presley强调了行业标准的重要性,特别是数据访问和元数据定义方面的标准。她提到,她的“数据解放”(Data Unchained)播客中反复出现的一个主题是,基因组学、高性能计算(HPC)和金融服务等不同科学领域缺乏标准化的元数据。Presley建议,像TPC25这样的计算社区最适合解决这一挑战,以确保元数据在工作流程和不同位置之间实现标准化和可搜索。
美国国家科学基金会(NSF)高级网络基础设施办公室主任、劳伦斯伯克利国家实验室员工Katie Antypas强调了劳动力发展是一个重大挑战。她强调需要行业伙伴关系和联邦政府的投资来培养下一代AI人才。Antypas指出,国家人工智能研究资源(NAIRR)项目是这项工作的关键举措,它旨在确保全国各地和所有领域的研究人员都能获得关键的AI资源,从而在最大的科技公司之外,培育一个健康的AI创新生态系统。
英特尔实验室高级研究员兼并行计算实验室主任Pradeep Dubey讨论了AI堆栈中的几个挑战。他指出了算法层面的一个根本性冲突:开发既高性能又值得信赖的模型。Dubey还谈到了AI模型中的“幻觉”问题,认为这并非缺陷,而是AI当前能力的一个固有特征。他还指出,如何让非编码人员也能使用AI是一个挑战,这些非编码人员更喜欢MATLAB等高级编程环境,而不是局限于低级GPU编程接口。
然而,TPC25大会上反复出现的最紧迫问题是迫在眉睫的电力短缺。Dubey警告说,运行大型AI工厂的巨大能源需求可能会压倒现有资源。他指出,大型AI系统中很大一部分能源(30-40%,可能上升到70-80%)消耗在数据移动而非计算上,导致能源使用效率低下。
解决这些挑战,从算法复杂性和劳动力发展到数据标准化和能源消耗,对于计算社区充分利用AI潜力并推进科学发现至关重要。正如美国能源部Hal Finkel总结的那样,广泛的、聚合的兴趣和社区驱动的努力,促进政府、国家实验室、工业界和大学所有利益相关者之间的协作和理解,对于这个共同的AI未来至关重要。