最近,吴恩达分享了团队关于 Agent Workflow (智能体工作流) 的研究成果,预测这将成为今年的流行趋势!
30123721-2024-03-30T04:37:46.png
👆 如上图所示,零样本 (Zero-shot) 模式下的 GPT-4 在 HumanEval (代码生成测评数据集) 上的准确率也只有 67.0%,但经过 Agent Workflow 加持的 GPT-3.5 准确率能飙升到惊人的 95.1%。

也就是说,Agent Workflow 能带来显著的效果提升。

以文章写作为例。零样本(Zero-Shot)指的是大语言模型在没有进行迭代修正的情况下直接生成最终输出,类似于人类在不回退删除的情况下一次性写完一篇文章。

但是,更符合人类写作经验的模式,是拆分成多个步骤,例如规划大纲、检索资料、撰写初稿、审阅初稿、修订草稿等,也就是上文提到的 Agent Workflow (智能体工作流)。

此外,吴恩达简单列举了几种团队验证有效的 Agent 设计模式,并预告会进行详细介绍,感兴趣关注一下他的 X 账号叭 👏

  • 反思(Reflection):让大语言模型对自己的结果检查改进
  • 使用工具(Tool use):让大语言模型调用外部工具,如网络搜索、代码执行等
  • 规划(Planning):让大语言模型自己设计一个多步骤的计划来达成目标
  • 多智能体协作(Multi-agent collaboration):多个 AI 智能体协同工作,分配任务,讨论和辩论想法,写作得到更好的结果

原文:https://www.deeplearning.ai/the-batch/issue-241/