摘要:
人类智能具有将基本技能组合成复杂技能以解决复杂任务的非凡能力。 这种能力对于人工智能 (AI) 同样重要,因此,我们断言,除了开发大型综合智能模型之外,让这些模型具备利用各种特定领域专家模型的能力同样重要,在追求通用人工智能 (AGI) 过程中解决复杂的任务。
大型语言模型 (LLM) 的最新发展展示了卓越的学习和推理能力,使其有望成为选择、综合和执行外部模型以解决复杂任务的控制器。
在这个项目中,我们开发了 OpenAGI,这是一个开源 AGI 研究平台,专门设计用于提供复杂的多步骤任务,并附带特定于任务的数据集、评估指标和各种可扩展模型。
OpenAGI将复杂任务制定为自然语言查询,作为 LLM 的输入。 LLM 随后选择、综合和执行 OpenAGI 提供的模型来解决任务。
此外,我们提出了一种任务反馈强化学习(RLTF)机制,该机制使用任务解决结果作为反馈来提高 LLM 的任务解决能力。 因此,LLM 负责综合各种外部模型来解决复杂的任务,而 RLTF 提供反馈以提高其任务解决能力,从而实现自我改进 AI 的反馈循环。
我们认为,LLM 运行各种专家模型来解决复杂任务的范例是一种很有前途的 AGI 方法。