过去一年时间,Agent 的飞速发展超出了我们预期,并且快速取得了行业共识,成为承载大模型应用的基本范式。围绕 Agent 正在逐步形成一套系统的方法论,和吸引了无数开发者、创业公司、资本及巨头的关注。

如果你想快速了解行业发展脉络、跟上行业共识,那最少需要了解以下内容:

AI Agent 发展大事记

  • 2023年3月,微软发布 Microsoft 365 Copilot,提示了一种基于 LLM 的应用开发范式,也就是今天形成行业共识的 Agent。
  • 2023年4月,以 AutoGPT 为代表的 Autonomous Agent 热度快速蹿升,同期比较受关注的类似项目还有 TaskMatrix.ai、HuggingGPT、AgentGPT、Toolformer、BabyAGI 等等。
  • 2023年6月,Lilian Weng 发布知名博文「LLM Powered Autonomous Agents」,进一步推升了 Agent 的热度。
  • 随后,Multi-Agent 框架相继发布并展示了解决复杂问题的能力,目前比较火的包括 Camel、MetaGPT、AutoGen。
  • 2023年11月,OpenAI 举办开发者大会 DevDay,推出官方 Agent 开发框架 Assistant API,使开发者能基于 GPT 模型开发 Agent。
  • 2024年1月,OpenAI 正式发布定制化 GPTs 和 GPT mentions,并随后上线 GPTStore。字节跳动海外版 Coze / 国内版扣子、Dify、百度千、天工、钉钉等国产 Agent 开发部署平台陆续被广大开发者熟知。

11 个顶级开源 Agent 框架

  1. AutoGPT:基于中岛洋平的论文开发,是一个用于构建和运行定制AI代理的工具包,使用OpenAI的GPT-4和GPT-3.5大型语言模型。
    https://github.com/Significant-Gravitas/AutoGPT
  2. BabyAGI:中山的任务驱动自主代理的简化版本,这个Python脚本只有140行代码,使用OpenAI和向量数据库来创建、优先处理和执行任务。
    https://github.com/yoheinakajima/babyagi
  3. SuperAGI:AutoGPT的更灵活、用户友好的替代品,包含构建、维护和运行自己代理所需的一切,包括插件和一个云版本。
    https://github.com/TransformerOptimus/SuperAGI
  4. ShortGPT:一个框架,允许使用大型语言模型来简化视频创作、语音合成和编辑等复杂任务。
    https://github.com/RayVentura/ShortGPT
  5. ChatDev:被打造成「一个虚拟软件公司」,使用多个代理人扮演传统开发组织中的不同角色,合作处理各种任务。
    https://github.com/OpenBMB/ChatDev
  6. AutoGen:微软开发的用于开发和部署多个代理的开源框架,这些代理可以共同工作以自主实现目标。
    https://github.com/microsoft/autogen
  7. MetaGPT:模仿传统软件公司结构的框架,代理被分配为产品经理、项目经理和工程师的角色,并协作完成用户定义的编码任务。
    https://github.com/geekan/MetaGPT
  8. camel:早期的多智能体框架之一,采用独特的角色扮演设计,使多个智能体能够相互通信和合作。
    https://github.com/camel-ai/camel
  9. Loop GPT:Toran Bruce Richards 的 AutoGPT 的一个迭代版本,改进了对 GPT-3.5 的支持,集成和自定义代理能力。
    https://github.com/farizrahman4u/loopgpt/tree/main
  10. JARVIS:以 ChatGPT 作为其「决策引擎」,处理任务规划、模型选择、任务执行和内容生成。
    https://github.com/microsoft/JARVIS
  11. OpenAGI:一个开源的AGI(人工通用智能)研究平台,结合了小型专家模型和来自任务反馈的强化学习(RLTF)来改进它们的输出。
    https://github.com/agiresearch/OpenAGI

LLM based Agent 初创公司分类

中间层infra:这类公司专注于提供实用的 Agent 框架,降低开发 Agent 的复杂性,并促进 Agent 间的合作。

  • 拿到知名机构投资的代表项目包括 AutoGPT、Imbue、Voiceflow、Fixie AI、Reworked、Cognosys、Induced ai等。

Vertical Agent:这类公司深入特定的行业领域,理解专家的工作流程,并运用 Agent 的思路来设计产品。

  • 拿到知名机构投资的代表项目包括:Dropzone(安全领域)、Middleware(大模型可观察性领域)、Parcha(Fintech领域)、Luda(游戏领域)、Outbound AI(医疗领域)、Fine(软件开发领域)。

创业建议

微软亚研院首席研究经理 谭旭

  • AI Agent 领域如何构筑护城河:要深入到 AI Agent 各个环节,提升其解决实际需求的能力,并在实际场景中得到优化方向的反馈。但是,AI Agent领域目前缺乏一个评估体系,指导这个设计和优化过程。
  • 阻碍相关研究落地的主因在于效果:目前唯一的瓶颈是现有研究效果无法达到落地指标,只有 AI 的效果能够真正达到我们的需求标准时,才会被大规模广泛使用

来也科技联合创始人&CTO 胡一川

  • AI Agent 落地数字员工时的挑战:① 模型的能力需要更强,因为业务复杂度可能超出现有模型的能力;② 应用生态需要更开放;③ 许多工作流程需要被优化和重构,以适应 AI Agent 的运作方式
  • 开发者选择大模型时的三个考量指标:① 效果考量,即需要在特定领域任务中表现出色;② 成本考量;③ 开源与闭源,服务B端客户时需要结合开源模型建立数据闭环。

真格基金管理合伙人 戴雨森

  • 回溯移动互联时代,对于中国早期AI创业者的三条建议:① 要灵活,用动态的眼光看待技术本身,适应技术的高速发展变化;② 商业化应先关注用户新增,再思考用户留存;③ 先关注用户价值,再思考商业模式,如果产品能带来用户价值,就始终有办法从中提取一部分成为商业化收入。
  • 创业公司如何把握入场时机:① 创业需要寻找大趋势和小拐点结合的时机,然后迅速做出行动;② 从经验注意的角度出发,如果你相信一件事迟早会发生,那么剋有每隔五年尝试一次。

真格基金EIR 季逸超

  • 不去抢有限的时间:让用户愿意为价值付费:① 在新平台出现之前, To C 创业者都是在与 TikTok/抖音争用户的注意力和时间;② (争不过) 所以,要寻找不需要长时间交互,但用户愿意付费的服务机会;③ 也就是说,不再跟成熟的产品去抢占用户有限的时间。