新方法可轻松让像ChatGPT的AI访问使用外部软件程序增强能力
AI研究人员开发了一种方法,Toolformer:语言模型可以自学使用工具,可以轻松地让像 Chat-GPT4 这样的 AI 访问和使用外部软件程序来增强其能力,语言模型(LMs)在处理新任务时表现出卓越的能力,仅凭几个示例或文本指令就能解决问题,尤其是在规模方面。然而,它们在基本功能上却往往表现不佳,如算术或事实查找,而更简单、更小的模型却表现出色。
在该研究中,作者展示了 LM 可以通过简单的 API 自学使用外部工具并实现两全其美。他们介绍了 Toolformer,这是一个经过训练的模型,可以决定调用哪些 API、何时调用它们、传递哪些参数,以及如何最好地将结果纳入未来的标记预测。这是以自我监督的方式完成的,只需要对每个 API 进行少量演示。他们整合了一系列工具,包括计算器、问答系统、两个不同的搜索引擎、翻译系统和日历。
Toolformer在各种下游任务中实现了显著改进的零样本学习性能,通常与更大的模型竞争,而不牺牲其核心语言建模能力。找有价值的信息,请记住Byteclicks.com