摘要:
大型语言模型 (LLM) 展示了卓越的零样本泛化能力:最先进的聊天机器人可以为日常生活中出现的许多常见问题提供合理的答案。 然而,到目前为止,LLM 无法可靠地解决长期规划问题。 相比之下,经典规划者一旦以格式化的方式给出问题,就可以使用高效的搜索算法来快速识别正确甚至最优的计划。 为了两全其美,本文介绍了 LLM+P,这是第一个将经典规划器的优势融入 LLM 的框架。 LLM+P 接受规划问题的自然语言描述,然后返回一个正确的(或最佳的)计划来用自然语言解决该问题。 LLM+P 首先将语言描述转换为用规划领域定义语言 (PDDL) 编写的文件,然后利用经典规划器快速找到解决方案,然后将找到的解决方案翻译回自然语言。 与 LLM+P 一起,我们定义了一组不同的基准问题,这些基准问题取自常见的规划场景。 通过对这些基准问题的全面实验,我们发现 LLM+P 能够为大多数问题提供最优解,而 LLM 无法为大多数问题提供可行的方案。