AgentVerse 是由清华大学、北邮等高校研究团队发布的一套AI多智能体协作模拟框架。提供了一个多功能的框架,简化了为大型语言模型(LLMs)创建自定义多智能体环境的过程。旨在快速、低成本的开发和定制,我们的框架赋能研究人员专注于他们的研究,而不被实现细节所困扰。

17152015-2023-09-17T07:20:29.png

✨ 特点

  • 🥳 高效的环境构建: 我们的框架提供了一系列基础构建模块,轻松创建多智能体环境。只需在配置文件中写入几行,你就可以轻松建立如LLMs的聊天室这样的基础环境。这个过程包括为LLMs定义环境的设置和提示,使像你这样的研究者能够专注于实验和分析。
  • ⚙️ 可定制组件: AgentVerse通过将多智能体环境分为五个功能模块并定义其各自的接口来简化它。对于不能直接使用AgentVerse提供的基本模块构建的复杂环境,你可以定制这五个功能模块中的一个或多个接口,根据你的要求高效地创建自己的多智能体环境。
  • 🛠 工具(插件)利用: AgentVerse支持多智能体环境的工具。目前,AgentVerse支持BMTools中提供的工具。
    17151949-2023-09-17T07:20:03.png

它可以很容易的模拟多种社会实验场景,例如:NLP课堂、囚徒困境、软件设计、数据库诊断、Pokeman等。它将问题的解决过程分为四个阶段:

  1. 专家招募:选择最合适的AI智能体专家参与任务
  2. 协作决策:专家共同讨论,提出解决问题的解决方案
  3. 行动执行:采取具体的行动
  4. 评估:评估当前结果和目标之间的差距。

NLP课堂模拟

NLP课堂上,教授与学生进行互动交流。当学生有问题时,他们纷纷举手,耐心等待教授点名。只有在教授点名后,学生才能发言并提出问题。

囚徒困境模拟

囚徒困境是一种思想实验,它向两个完全理性的代理人提出两难的挑战:他们可以与伴侣合作以实现互惠互利,也可以背叛他们的伴侣(“缺陷”)以获得个人奖励。

软件设计模拟
13232715-640.gif
在软件设计示例中,程序员、测试和代码审查员协作解决代码生成问题。给定一个问题,程序员首先编写代码实现。测试人员运行单元测试并提供反馈。然后代码审查员会生成评论。在收集测试反馈和审查后,程序员迭代地完善代码。

数据库诊断模拟

在数据库诊断场景中,首席DBA监控数据库系统是否存在异常。如果检测到异常,内存和 CPU 智能体会收到警报,分析根本原因并提出优化解决方案。然后,首席 DBA 向用户提供总结性诊断,用户也可以通过提供说明或评估解决方案的有效性来互动。

文本生成质量评估

在 AgentVerse 上建立了一个多智能体裁判团队来评估不同模型生成的文本的质量。当给定两段不同的文本时,各个智能体可以利用分配给他们的角色,自主地辩论生成文本的差别,并给出对生成质量的判断。

Pokeman游戏模拟

在游戏中,智能体可以参观商店,在健身房训练他们的神奇宝贝,并相互互动。作为玩家,可以扮演其中智能体的角色,随时与其他智能体互动。其中包含 6 个出现在《Pokemon Emerald》中的角色:May、Birch 教授、Steven Stone、Maxie、Archie 和 Joseph。

项目地址:https://github.com/OpenBMB/AgentVerse
论文地址:https://arxiv.org/abs/2308.10848