LLM“思维链”:脆弱的模式匹配,而非真正推理
亚利桑那州立大学(ASU)研究人员的一项新研究,对大型语言模型(LLM)中备受赞誉的“思维链”(CoT)推理提出了批判性观点,认为它可能并非真正智能的标志,而更像是一种“脆弱的海市蜃楼”。这项研究为不断增长的、审视LLM推理真实深度的文献增添了新内容,但其独特之处在于,它采用“数据分布”视角,系统地找出CoT能力在何处以及为何会失效。至关重要的是,对于那些正在构建应用程序的人来说,该论文超越了单纯的批判,提供了关于如何在LLM驱动的系统中应对这些限制的实用指导,从测试策略到微调的作用。