AI“思考”过度?新研究发现:跳过思考步骤可能更快更聪明
近年来,大型语言模型(LLMs)的能力突飞猛进,尤其在逻辑推理方面,它们仿佛拥有了“思考”的能力。
通常,我们认为这种强大的推理能力来自于 AI 模仿人类的“深思熟虑”过程。这些顶尖的 AI在给出最终答案前,会生成一大段长长的“思考过程”。这个过程可能包含了对问题的拆解、各种方法的尝试、自我反思、验证和修正,最后才提炼出简洁的解题步骤和最终答案。
这种“展示思考过程”的方式,确实让 AI 在解决复杂问题上取得了巨大成功。通过强化学习或者在大量带有推理过程的数据上进行微调,AI 学会了这种结构化的“思考”模式。大家普遍认为,正是这个详细的“思考”过程赋予了 AI 强大的推理能力,因此,“让 AI 花更多时间思考”(即增加推理时的计算量)似乎成了提升其能力的标准范式。但这带来了一个显而易见的代价:时间和资源。生成这些长篇大论的“思考”过程,需要消耗大量的计算资源(更多的 tokens),也意味着用户需要等待更长的时间(高延迟)才能得到结果。
为创新充能 1元 查看完整内容!立即支付