掌握期望:成功AI项目的关键
人工智能项目要真正取得成功,期望管理这门艺术至关重要。与传统的软件开发不同,AI项目天生就充满不确定性,这一特性既能推动也能阻碍整个项目。许多利益相关者,通常不熟悉AI的复杂运作方式,未能理解错误不仅仅是故障,而是流程中固有且往往关键的一部分。因此,缺乏清晰定义的期望会迅速导致项目偏离轨道并令人失望。
在这种环境下,一个关键的建议是抵制过早承诺性能的冲动。在彻底了解数据、操作环境甚至项目的精确目标之前,就承诺具体的指标,是通向失败的必经之路。这种过早的保证常常导致目标无法实现,甚至更糟,会促使人们操纵统计结果以粉饰太平。一种更审慎的方法是,将性能讨论推迟到深入探索数据和手头问题之后。一些领先的做法甚至提倡设立一个初始的“阶段0”,这是一个专门用于探索潜在途径、评估可行性并在正式项目批准前建立基线的初步阶段。只有在团队对现有数据拥有完全信心和深入了解,或者相同的问题之前已成功解决多次的情况下,才可能需要提前做出性能承诺。
从项目启动之初就识别并理解所有利益相关者同样至关重要。AI项目很少只涉及单一的、同质的受众;通常,它们包含商业和技术背景的多元组合,每个群体都有其独特的优先事项、视角和成功定义。有效的利益相关者分析在此变得不可或缺,它要求彻底理解他们的个人目标、担忧和期望。然后,在整个项目生命周期中,必须根据这些不同的维度调整沟通和决策。例如,业务利益相关者主要关注投资回报和运营影响,而技术同行则会审查数据质量、基础设施和可扩展性。忽视任何一方的需求都可能严重阻碍产品或解决方案的成功交付。一个与产品扫描应用集成的过往项目完美地说明了这一点:通过及早与该应用的开发人员接触,项目团队发现他们计划构建的精确功能,第三方已计划在几周内推出,从而节省了大量时间和资源。
此外,从一开始就传达AI的概率性质至关重要。与确定性的传统软件不同,AI基于概率运作,对于不习惯这种不确定性的人来说,这是一个挑战。人类天生不擅长概率思维,这就是为什么早期和清晰的沟通至关重要。如果利益相关者期望万无一失、100%一致的结果,那么当现实不可避免地偏离这一愿景时,他们的信任会迅速瓦解。生成式AI提供了一个当代且相关的例子:即使输入相同,输出也鲜有完全相同的。及早利用此类演示可以有效地说明这一基本特征。
从第一天起就建立分阶段的里程碑,为利益相关者提供了清晰的检查点,以便评估进展并做出明智的“继续/停止”决策。这不仅能培养信心,还能确保在整个过程中期望的持续对齐。每个里程碑都应伴随一套一致的沟通例程,无论是通过报告、总结邮件还是简短的指导会议,让每个人都了解进展、风险和下一步计划。记住,利益相关者宁愿及早听到坏消息,也不愿被蒙在鼓里,这一点至关重要。
在报告项目进展时,重点应始终从纯粹的技术指标转向展示切实的业务影响。虽然像“准确性”这样的技术指标看似简单,但它们的真正价值往往取决于上下文。例如,一个60%准确的模型在纸面上可能显得很差,但如果每个真实阳性结果都能为组织带来可观的节省,而假阳性成本极低,那么这60%突然变得极具吸引力。业务利益相关者常常过分强调技术指标,因为它们更容易理解,这可能导致对成功或失败的误导性看法。实际上,阐明业务价值要强大得多,也更容易被接受。例如,一个旨在检测设备故障的算法,如果误报会导致昂贵的生产线停工,则可能优先考虑精度而非原始准确性,从而通过避免不必要的干扰来最大化节省,同时仍能捕获最有价值的故障。
另一个需要及早讨论的关键权衡是模型准确性和可解释性之间。更准确的模型并不总是更具可解释性;通常,那些产生最高性能的技术,例如复杂的集成方法或深度学习,在解释其预测时也最为不透明。相反,更简单的模型可能会牺牲一些准确性以换取更高的透明度。这并非本质上的好坏,而是必须与项目目标保持一致的决策。在金融或医疗保健等高度监管的行业中,可解释性可能 outweighs 边际准确性增益,而在营销领域,显著的性能提升可能因可观的业务回报而证明降低透明度是合理的。在确定方向之前,确保利益相关者就这一平衡达成一致至关重要。
最后,任何AI项目的最终目标都是部署,这意味着模型从一开始就应该以实际应用为目标进行设计和开发。一个被限制在实验室中、无法扩展、集成或维护的令人印象深刻的模型,仅仅是一个昂贵的概念验证,没有持久影响。及早考虑部署要求——包括基础设施、数据管道、监控和再训练流程——确保AI解决方案将是可用、可维护且有影响力的,从而为利益相关者带来真正的价值。
对于生成式AI项目,坦诚地讨论成本也必不可少。虽然生成式AI可以提供令人印象深刻的准确性,但要达到面向消费者工具所见的性能水平,通常会产生显著的费用。这可能涉及在单个工作流中多次调用大型语言模型(LLM),实施涉及多步推理的复杂“智能体AI(Agentic AI)”架构,或者使用更昂贵、容量更大的LLM,这会大幅增加每次请求的成本。因此,生成式AI的性能始终是质量、速度、可扩展性和成本之间的微妙平衡。业务用户常常假设消费级性能可以直接转化为他们的用例,却不知道这些结果通常是通过对于大规模生产而言成本过高的配置实现的。及早设定现实的期望,确保如果需要顶级性能,业务方能理解相关成本;反之,则接受在严格预算限制下,平衡性能与可负担性的“足够好”解决方案。